Uvod v vprašanja in odgovore o intervjuju Hbase

HBase je priljubljen stolpčno usmerjen sistem za upravljanje baz podatkov NoSQL, ki deluje na vrhu Hadoop Distributed File System (HDFS). Zelo je primeren za redke nabore podatkov, ki so pogosti v številnih primerih uporabe velikih podatkov.

Tukaj je prvih 10 najpogostejših vprašanj in odgovorov za intervju za HBase v letu 2019: Torej ste končno našli svojo sanjsko službo v HBaseu, sprašujete pa se, kako polomiti intervju s Hbase in kaj bi lahko bilo verjetno v letu 2019 Hbase Interview vprašanja. Vsak intervju je drugačen in tudi obseg dela je drugačen. Upoštevajoč to, da smo zasnovali najpogostejša vprašanja in odgovore Hbase Interview, ki vam bodo pomagali doseči uspeh v intervjuju. Ta vprašanja so razdeljena na dva dela:

1. del - Vprašanja za intervju z HBase (osnovno)

Ta prvi del zajema osnovna vprašanja in odgovore za HBase Interview.

1. Kdaj morate uporabljati HBase?

Odgovor:
Hbase ni primeren za vse primere uporabe. Najboljši primeren scenarij je mogoče prepoznati z naslednjimi pregledi -
i.Data količina: mora imeti petabajte podatkov za obdelavo v porazdeljenem okolju.
ii.Aplikacija: HBase ni primeren za sisteme OLTP (spletna obdelava transakcij), ki zahtevajo zapletene transakcije z več stavki. Prav tako primanjkuje zapletene podpore SQL, ki je potrebna za relacijsko analitiko. Prednost je, če imate veliko količino podatkov z nekoliko drugačna shema.
iii.Klusterska strojna oprema: HBase deluje poleg HDFS. In HDFS deluje učinkovito z velikim številom vozlišč (najmanj 5). Torej je HBase lahko dober izbor le z dobro strojno podporo.
iv.Ne tradicionalni RDBMS: Hbase ne podpira nobenega primera uporabe, ki zahteva tradicionalne funkcije, kot so Pridruži se več tabel, Kompleksni SQls z ugnezdenimi ali okenskimi funkcijami itd.
v.Hiter hitri naključni dostop do podatkov: Če potrebujete naključen in sproten dostop do svojih podatkov, je HBase primeren kandidat. Odlična je tudi za shranjevanje velikih tabel z večstrukturiranimi podatki.

2. Kakšna je razlika med Cassandra in HBase?

Odgovor:
Tako HBase kot Cassandra imata distribuirano bazo NoSQL za velike podatke iz ekosistema Hadoop. Obe zgrajeni za različne primere uporabe.
HBase ima nekakšno arhitekturo master-slave z več komponentami, kot so Zookeeper, Namenode, HBase Master (Hmaster) in Data vozlišča itd. Cassandra obravnava vsa vozlišča kot glavna, kar pomeni, da so vsa vozlišča enaka in opravljajo vse funkcije.
HBase je optimiziran za branje, pisanje se dogaja samo v glavnem vozlišču in ima močno konsistenco za branje po pisanju. Če je izbrana morebitna doslednost, ima Cassandra odlično branje v eni vrstici.
Hbase izvorno ne podpira sekundarnih indeksov, Cassandra podpira sekundarne indekse za družine stolpcev, kjer je ime stolpca znano.
Sprva je Hbase ustvarjen v Googlu in so ga poimenovali BigTable. Tudi API-ji Bigtable in HBase so zdaj združljivi. Origin Cassandra je iz prispevka za DynamoDB, ki je NoSQL baza podatkov iz AWS.

Pojdimo na naslednja vprašanja o intervjuju za HBase.

3. Kateri so glavni sestavni deli Hbase?

Odgovor:
HBase a ima tri pomembne komponente - HMaster, Region Server in ZooKeeper.
i.HBase Master - HBase tabele so razdeljene na regije. Medtem ko zagonski Master odloči, katero regijo dodeliti strežniku regije (strežnik regije bo vozlišče v grozdu). Ravno tako obravnava operacije metapodatkov tabele, kot so ustvarjanje ali sprememba sheme. Ta komponenta ima tudi pomembno vlogo pri okrevanju odpovedi
ii. Regijski strežnik - Kot že omenjeno, se tu zgodi dejansko pisanje in branje podatkov. To so dejanska vozlišča grozdov. To bo imelo regije številnih tabel, o čemer se odloči z začetkom in zaključkom tipk vrstice. Običajni regijski strežnik lahko služi do tisoč regij
iii.ZooKeeper - ZooKeeper je okvir za usklajevanje grozdov, ki se pogosto uporablja v ekosistemu Hadoop. Zookeeper sledi vsem strežnikom (glavnim in regijskim strežnikom), ki so prisotni v grozdih stikih HMaster ZooKeeper, in v primeru napak nastanejo obvestila.

4. Kaj je HBase Bloom Filter?

Odgovor:
To so pogosta vprašanja o intervjuju HBase, ki so jih postavili v intervjuju. HBase Bloom Filter je učinkovit mehanizem za preverjanje, ali je shranjevalna datoteka (Ko nekaj zapišemo v HBase, se najprej zapiše v shrambo v pomnilnik, ko ta pomnilnik doseže določeno velikost, se spusti na disk v shranjevalno datoteko ) vsebuje določeno celico vrstice ali vrstice z vrsticami. Običajno je edini način, da se odločimo, ali je ključ vrstice v datoteki shrambe, preveriti indeks blokov datoteke, ki vsebuje začetni ključ vrstice vsakega bloka v shrambeni datoteki. Bloom filtri delujejo kot podatkovna struktura v pomnilniku, ki pomaga zmanjšati branje diska samo na datoteke, ki verjetno vsebujejo to vrstico - Ne na vse datoteke v trgovini. Tako deluje kot indeks v pomnilniku, ki kaže na verjetnost iskanja vrstice v določeni datoteki shrambe.

5. Kaj je zbijanje? Pojasnite mu različne vrste.

Odgovor:
HBase shrani vse prejete operacije v svoje pomnilniško področje memstore. Ko je pomnilniški medpomnilnik poln, se sproži na disk. Ker to lahko ustvari veliko majhnih datotek v HDFS, lahko HBase občasno izbere datoteke, ki jih je treba strniti v večje. Zbijanje se imenuje Manjše, ko HBase izbere samo nekaj HFi-jev, ki jih je treba kompaktirati, ne pa vseh. V velikem strnjenju so vse datoteke izvoljene za strpanje skupaj. Večje stiskanje deluje kot manjše, le da je mogoče izbrisati označevalce, potem ko so uporabljeni za vse povezane celice, in vse dodatne različice iste celice bodo tudi izpuščene.

2. del - Vprašanja za intervju z HBase (napredno)

Oglejmo si zdaj napredna vprašanja o intervjuju za HBase.

6.Kako podatki o različici HBase?

Odgovor:
Ko bo kos podatkov vstavljen / posodobljen / izbrisan, bo HBase ustvaril novo različico za ta stolpec. Dejansko brisanje se dogaja samo med zgoščanjem. Če je določena celica presegla več dovoljenih različic, bodo med zgoščanjem izpuščene dodatne različice

7. Kakšna je razlika med pridobivanjem in skeniranjem?

Odgovor:
Get bo vrnil samo eno vrstico iz tabele Hbase glede na dani ključ vrstice. Ukaz optičnega branja vrne niz vrstic, odvisno od pogoja iskanja. Običajno je hitrejši od skeniranja. Zato raje uporabite to, če je mogoče.

Pojdimo na naslednja vprašanja o intervjuju za HBase.

8. Kaj se zgodi pri brisanju vrstice?

Odgovor:
Ob izbrisu se podatki ukazov fizično ne izbrišejo iz datotečnega sistema, namesto da postavijo oznako nevidno. Fizično brisanje se zgodi med zbijanjem
Oznake za brisanje stolpcev, različice in družine so tri različne vrste označevalcev, ki označujejo črtanje stolpca, različico stolpca in družino stolpcev.

9. Pojasnite razliko med HBase in Pive.

Odgovor:
To je napredno vprašanje za intervju HBase, ki so ga postavili v intervjuju. HBase in Hive sta popolnoma različni tehnologiji za obdelavo podatkov na osnovi Hadoop-a. Hive je relacijski podoben SQL združljiv okvir za shranjevanje, medtem ko je HBase NoSQL trgovina s ključnimi vrednostmi. Hive deluje kot abstrakcijski sloj na vrhu Hadoopa s podporo za SQL. Vzorec dostopa do podatkov HBase je zelo omejen z dvema primarnima operacijama - pridobivanje in skeniranje. HBase je idealen za sprotno obdelavo podatkov, kjer je Hive idealna izbira za paketno obdelavo podatkov.

10. Kaj sta Hlog in HFile?

Odgovor:
HLog je datoteka dnevnika zapisovanja vnaprej, znana tudi kot WAL, HFile pa je prava datoteka za shranjevanje podatkov. Podatki se najprej zapišejo v datoteko dnevnika vnaprej in se napišejo tudi v MemStore. Ko je MemStore poln, se vsebina MemStore-ja sproži na disk v HFiles.

Priporočeni članek

To je vodnik za seznam vprašanj in odgovorov o intervjuju za Hbase, tako da lahko kandidat brez težav razreši ta vprašanja o intervjuju za Hbase. Če želite izvedeti več, si oglejte tudi naslednje članke -

  1. Uporabna vprašanja o skupinskem intervjuju
  2. Pomembni osnovni nasveti za intervju
  3. Bistveni koraki za intervju
  4. Intervjujska vprašanja, ki jih želite vprašati za finančnega kandidata

Kategorija: