What is Apache HBase and when should you use it?

Pregled: Apache HBase can be defined as the Hadoop database. It is a distributed, non-relational and open source database written in Java. It is developed based on the Google BigTable framework and runs on HDFS (Hadoop distributed file system). Apache HBase se uporablja, ko imate zahtevo naključno, v realnem času dostop do vašega velikega obsega podatkov. HBase je primeren kandidat, če imate na stotine milijonov ali milijard vrstic in dovolj strojne opreme, da ga podpirajo. Kot je HBase temelji na HDFS in HDFS dobro deluje, ko je minimalni 5 podatkovnih vozlišč. Torej, na kratko, HBase je "skladišče podatkov’ Okvir tipa, ki se distribuira in primerna za obdelavo velikih količin podatkov.

V tem članku bom razložil podrobnosti z arhitekturnimi koncepti.

Predstavitev: Apache HBase je NoSQL stolpec usmerjen sistem za upravljanje baz podatkov, ki teče na vrhu HDFS. HBase ne podpira Structured Query Language kot SQL. Aplikacije HBase so vse naloge MapReduce in napisana v Java. HBase podpira aplikacije, napisane v REST, Varčnost in Avro. Nekatere pomembne funkcije v HBase so našteti spodaj.

• HBase podpira samodejno sharding.
• HBase podpira HDFS kot svojo porazdeljeno shranjevanje.
• HBase podpira MapReduce za paralelno obdelavo ogromno količino podatkov.
• HBase ima podporo za Java strank API.
• HBase podpira močno dosledno brati in pisati operacij. Primeren je za nasprotno agregacijo visoke hitrosti.

Razlika med HBase in HDFS: Opisali smo, da je HBase temelji na vrhu HDFS. Torej boste morda morali zmedo, ki HDFS in HBase podobno. Vendar morate vedeti, da je HDFS ni preprost datotečni sistem, ampak je porazdeljena shranjevanje primerna za shranjevanje velike količine podatkov. HDFS ne podpira hiter zapis pogledate za velikega obsega podatkov. Ampak HBase deluje na vrhu HDFS in zagotavlja hitro poglej gor in posodobitev.

Kdaj morate uporabiti HBase?
HBase je tipičen NoSQL in stebra podatki trgovina. Izbira podatkovne baze NoSQL in RDBMS odvisna od zahteve uporabe. Torej, najprej, moramo jasno razumeti zahteve in nato izberite zbirko podatkov. Če ste pravkar izbrali NoSQL DB brez ustrezne analize, potem bi to povzročilo težave za vas. In bo tudi zloraba tehnologije in virov. Po nekaj točk, ki jih je treba upoštevati pri izbiri NoSQL DB kot HBase.

Volume: Obseg podatkov je prva merila za izbiro NoSQL DB. Moral bi imeti neskončne podatke (milijone ali milijarde vrstic) za proces in trgovini. Če imate le nekaj tisoč ali milijon vrstic nato tradicionalna RDBMS je najbolj primerna. Toda, če izbere HBase za majhno količino podatkov, nato pa bodo podatki kopičijo v enem vozlišče in drugi vozlišča v gruči bo sedel nedejaven.

Podpora za strojno opremo: HDFS učinkovito izvaja, če obstaja vsaj 5 podatkovnih vozlišč. Ker vemo, da je HBase temelji na HDFS, zato bi morali imeti dovolj podpore strojne opreme za izvajanje HBase DB.

Ni potrebe za RDBMS funkcije: Prepričajte se, da vaša aplikacija ne zahteva dodatnih funkcij, ki jih tipično RDBMS. Napredne funkcije, kot so transakcije, kompleksno vprašanje, sprožilci jih HBase ne podpira. Torej, to je še en pomemben kriterij za izbor.

HBase oblikovalskih zasnov:
Koncepti oblikovanja stojijo HBase so podobni HDFS in okvir MapReduce. Kot vsa dela v porazdeljenem okolju, splošna zasnova temelji na master-slave arhitekture. HDFS deluje na NameNode in podrejenih vozlišč, MapReduce deluje na JobTracker in TaskTracker sužnjev. Podobno HBase ima naslednjo master slave arhitekturo.

  • Master vozlišče upravlja grozd.
  • Podatki trgovin miza regiji strežnikov in delo na podatkih.

Kot je nadrejeno vozlišče glavni regulator, HBase je zelo občutljiv na izgubo njegove nadrejeno vozlišče.

HBase Ogledov: HBase je ob tabelarni pogled za shranjevanje podatkov. Glavni koncept temelji na stolpcu družine. HBase miza je narejena iz nizov, stebri in vsak stolpec pripada družini stolpca. Ključ tabela vrstica je primarni ključ za dostop do tabele. Ključ vrstica je lahko karkoli, in vrstice so razporejene po ključu vrstice. Po sta dva pogleda, ki opisujejo koncepte.

Konceptualni pogled: V tem poglavju bom razložiti konceptualni pogled, ki ga pri tem zgled. Tabela vsebuje družine stolpcev in družine stolpec vsebuje stolpce. Konvencija je, da je stolpec sestavljena iz treh delov – stolpec priimek, Predpona in stolpec ime. Lik debelo črevo (:) zamejuje družino kolone in kolone. Naj en primer, ime tabele je "hbasetable’ ob colfamily1 dve družini stolpcu "’ and ‘colfamily2’. V nadaljevanju colfamily1’ ima ime dveh stolpcih "’ in "naslov". V nadaljevanju colfamily2’ ima en stolpec 'telno ". Torej bi bila struktura, kot je prikazano spodaj.

Preglednica "Hbasetable’

colfamily1: name = “Ricardo”

colfamily1: naslov = “MA, ZDA”

colfamily2: telno = “2235678”

Pogled tabular bo izgledal spodaj.

Vrstica Key Čas Stamp ColumnFamily colfamily1 ColumnFamily colfamily2
"Rowkey1" T1 colfamily2: telno = “2235678”
"Rowkey2" T2 colfamily2: telno = “9995678”
"Rowkey3" T3 colfamily2: telno = “8896578”
"Rowkey4" T4 colfamily1: name = “Ricardo”
"Rowkey5" T5 colfamily1: naslov = “MA, ZDA”

Preglednica 1: Tabelarični pogled "hbasetable"

Fizični pogled: Smo že razpravljali konceptualni pogled HBase mizo in njegovo vsebino. Toda fizični pogled je nekoliko drugačen. Fizično, mize HBase so shranjeni na družinski stolpec podlagi. Torej se novi stolpci lahko enostavno doda brez predhodnega obvestila. Ta funkcija dodaja fleksibilnost linearno razširljivost, ki smo jih prej razpravljali.

Potem so tabelarni pregled dveh družin stolpcev.

Vrstica Key Čas Stamp ColumnFamily colfamily1
"Rowkey4" T4 colfamily1: name = “Ricardo”
"Rowkey5" T5 colfamily1: naslov = “MA, ZDA”

Table2: Prikaz colfamily1

 

Vrstica Key Čas Stamp ColumnFamily colfamily2
"Rowkey1" T1 colfamily2: telno = “2235678”
"Rowkey2" T2 colfamily2: telno = “9995678”
"Rowkey3" T3 colfamily2: telno = “8896578”

Table3: Prikaz colfamily2

Prosimo, upoštevajte, da se prazne celice prikazane v konceptualnem pogledu dejansko ni shranjena. Shranjevanje je dovoljeno samo za stolpec usmerjeno strukturo za shranjevanje. Torej, če smo poizvedbo nekaj podatkov na določen časovni žig "T1’ from ‘colfamily1’, potem bi vrnil ničesar. Enako pa velja tudi za "colfamily2’ Prav tako, vsi časovni žigi so shranjene v padajočem vrstnem redu. Torej najnovejša vrednost iz posameznega stolpca bi se vrne, če ni čas žig omenjeno v poizvedbi.

Zaključek: Pred zaključkom razprave, moramo imeti v mislih, da je HBase open source, NoSQL porazdeljene baze podatkov, ki je primerna za shranjevanje in obdelavo neskončne količine podatkov. To je bil razvit v okviru projekta Apache Hadoop in temelji na okviru HDFS. Operacije HBase so vse naloge MapReduce, ki vodijo v vzporedni način. Osnovna ideja je, enako kot Googlov Bigtable. Izbor NoSQL podatkovne zbirke je treba narediti previdno. Zasnova Zasnova RDBMS in NoSQL je popolnoma različni tako Prenos podatkov iz RDBMS do HBase ni mogoča. Celotna zasnova je treba spremeniti, da prehod iz RDBMS za NoSQL HBase.

Tagged on:
============================================= ============================================== Buy best TechAlpine Books on Amazon
============================================== ---------------------------------------------------------------- electrician ct chestnutelectric
error

Enjoy this blog? Please spread the word :)

Follow by Email
LinkedIn
LinkedIn
Share