Uvod v panj s panjem

Ključna beseda "DROP" se nanaša na črtanje. Za izbris podatkov zahtevamo, da so podatki prisotni v panju.

V Hadoopu imamo dve funkcionalnosti:

  1. Shranjevanje podatkov
  2. Obdelava podatkov

Za shranjevanje podatkov pride v sliko HDFS (Hadoop Distributed File System). Ko rečemo, da imamo podatke v tabeli panja, to pomeni dve stvari:

  1. Podatki so v HDFS
  2. Nad to datoteko HDFS imamo izdelano tabelo panj in podatke te datoteke HDFS naložimo v tabelo panja.

Torej, v bistvu je, da ima tabela s panjem panje podatke, podatkovna datoteka pogoj. V tem članku si bomo ogledali, kako spustiti mize v panj, kaj se zgodi ob padcu mize in vse stvari, povezane s tabelo za padec v panju.

Vrste tabel s kapljicami v panju

V panju so dve vrsti miz:

  1. Notranja ali upravljana tabela
  2. Zunanja tabela ali tabela brez upravljanja

Upravljana tabela / notranja tabela:

  1. V panju je privzeti imenik » uporabnik / panj / skladišče « . Notranje tabele so privzeto shranjene v tem imeniku. Med ustvarjanjem tabele nam ni treba ročno navesti lokacije.
  2. Ukaz "Spusti tabelo" podatke trajno izbriše.
  3. Hive upravlja vso varnost za upravljane tabele.

V imeniku »uporabnik / panj / skladišče« imam tabelo, ki se imenuje »kode«.

Če želite preveriti, ali se z obstoječo tabelo upravlja ali ne upravlja, lahko uporabimo spodnji ukaz:

Sintaksa ukaza:

Opišite oblikovano ime tabele;

Izhod:

Poglejmo, podatke, predstavljene v tabeli „kode“.

Najprej z uporabo panj ukaz-

Drugič, z uporabo Hue (Hadoop User Experience a Web UI)

Ukaz ukaz: Izbriši tabelo ime_na tabele;

Izhod:

Zdaj, če želim izbrati podatke iz »kode«, se mi bo zgodila napaka, ker je tabela izbrisana.

Prav tako te tabele ne bo mogoče videti v privzetem imeniku, ki je

"Uporabnik / panj / skladišče"

Opazujte tukaj,

Neupravljana tabela / Zunanja tabela:

  1. Zunanje tabele moramo določiti pot, kamor jo moramo shraniti s ključno besedo 'location' v ukazu create table.

Primer:

USTVARJA ​​ZUNANJI TABELO stg_s2_json.products

(ni nobenega izdelka, niz imena izdelka, opisni niz, aktivni niz, ustvarjen datumski niz, posodobljen niz datumov).

LOKACIJA '/user/data/hive/stg_s2_json.db/products';

  1. Hive briše samo metapodatke. Podatki so trajni.
  2. Te tabele lahko uporablja vsakdo, ki ima dostop do HDFS, zato jim je treba upravljati varnost na ravni mape.

Za razumevanje spuščanja zunanje tabele bomo uporabili tabelo »izdelki«.

Preverimo, ali je tabela notranja ali zunanja. Spet ukaz "opišite oblikovano ime tabele".

Upoštevajte "omejitev 10" v izbirnem ukazu. Tabela Izdelki vsebujejo spodnje podatke:

Če ga želite preveriti v Hueju, je videti nekako takole:

Poglejmo, kaj se zgodi, ko spustimo to tabelo:

Sintaksa:

Drop table table_name;

Izhod:

Če poskušate pridobiti podatke tabele, vrže napako.

Prvič, z uporabo ukaza "select" na terminalu se mi bo vrgla napaka, kar pomeni, da so metapodatki za zunanjo tabelo izbrisani.

Tu opazite napako:

Drugič, če preverite stanje podatkov, je datoteka „products.json“ še vedno prisotna v HDFS, kar pomeni, da so podatki trajni.

Zaključek

To bom olajšal in vam zagotovil ključne točke za obe vrsti tabel. Odločili se boste, katera vrsta bo ustrezala vašim zahtevam.

Notranja tabela

Zunanja tabela

Imenuje se tudi »Upravljana tabela«Imenuje se tudi »Neupravljana tabela«
Ni treba navajati lokacije, privzeti imenik Hive upravlja te podatkeMorate zagotoviti lokacijo
Izbriše tudi metapodatke tabele (Podatki so začasni)Hive bo pustil podatke nedotaknjene (podatki so trajni)
Panj sam nadzoruje varnost mizePotrebujete upravljanje varnosti na ravni mape

Priporočeni članki

To je priročnik za Pive Drop Table. Tukaj razpravljamo o uvedbi tabele kapljic v panju, vrstah kapljic v panju vzdolž sintakse. Če želite izvedeti več, lahko preberete tudi druge naše predlagane članke -

  1. Kaj je panj?
  2. Arhitektura panj
  3. Ukazi panj
  4. Kaj je Oracle Database
  5. Naročilo za panj
  6. Namestitev panj

Kategorija: