Exploring HBase NoSQL DB

HBase NoSQL DB

HBase NoSQL DB,,en,Exploració de funcions,,en,és una de les bases de dades no relacionals més populars construïdes a sobre,,en,i HDFS,,en,Sistema d'arxius distribuïts de Hadoop,,en,També es coneix com a base de dades Hadoop,,en,Com a projecte Apache,,en,HBase és de codi obert,,en,Versió i distribució,,en,DB escrit en llenguatge Java,,en,Es construeix seguint Google,,en,Bigtable,,en,conceptes,,en,Apache HBase és apte per a casos d'ús en què es necessita accés de lectura i escriptura a temps real i aleatori a gran volum de dades,,en,Com HBase funciona a la part superior de,,en,el rendiment també depèn del suport del maquinari,,en,Hem de proporcionar un nombre suficient de nodes,,en,mínim,,en,per obtenir un millor rendiment,,en,explorarem diferents aspectes de l'HBase i la seva aplicabilitat,,en,Quines són les característiques de Hbase NoSQL DB,,en,Apache HBase és una base de dades orientada a columnes que admet l'esquema dinàmic de la base de dades,,en – Exploring features

Visió de conjunt: Apache HBase is one of the most popular non-relational databases built on top of Hadoop and HDFS (Hadoop Distributed File system). It is also known as Hadoop database. As an Apache project, HBase is an open-source, versioned and distributed NoSQL DB written in Java language. It is built by following Google’s Bigtable concepts. Apache HBase is suitable for use cases where you need real time and random read/write access to huge volume of data (Big data). As HBase runs on top of HDFS, the performance is also dependent on the hardware support. We need to provide sufficient number of nodes (minimum 5) to get a better performance.

In this article, we will explore different aspects of HBase and its applicability.








What are the features of Hbase NoSQL DB?

Apache HBase is a column oriented database which supports dynamic database schema. Funciona principalment amb HDFS i suporta treballs de MapReduce,,en,HBase també admet altres idiomes d'alt nivell per al processament de dades,,en,Fem una ullada a les diferents característiques de HBase tal com es detalla a continuació,,en,HBase permet l'escalabilitat en forma lineal i modular,,en,Sharding,,en,HBase és compatible amb l'estalvi automàtic de taules,,en,També és configurable,,en,Emmagatzematge distribuït,,en,HBase permet l'emmagatzematge distribuït com HDFS,,en,És compatible amb operacions de lectura i escriptura coherents,,en,Suport de bloqueig,,en,HBase és compatible amb la failover automàtica,,en,Suport de l'API,,en,HBase és compatible amb les API de Java perquè els clients puguin accedir fàcilment,,en,MapReduir suport,,en,Compatible amb HBase,,en,per al processament paral·lel de gran volum de dades,,en,Suport de suport,,en,HBase admet una còpia de seguretat d'Hadoop,,en,treballs en taules HBase,,en,Processament en temps real,,en,Suporta blocs de bloqueig i filtres Bloom,,en,Així, el processament de consultes en temps real és senzill,,en. HBase also supports other high level languages for data processing.

Let us have a look at different features of HBase as mentioned below.

Scalability: HBase supports scalability in both linear and modular form

Sharding: HBase supports automatic sharding of tables. It is also configurable.

Distributed storage: HBase supports distributed storage like HDFS

Consistency: It supports consistent read and write operations

Failover support: HBase supports automatic failover

API support: HBase supports Java APIs so clients can access it easily

MapReduce support: HBase supports MapReduce for parallel processing of large volume of data

Back up support: HBase supports back up of Hadoop MapReduce jobs in HBase tables

Real time processing: It supports block cache and Bloom filters. So real time query processing is easy

A més de les característiques principals anteriors,,en,HBase també és compatible,,en,Serveis web restants,,en,closca basada en jruby,,en,Ganglia i JMX,,en,HBase té una presència molt forta en el món de bases de dades NoSQL,,en,HBase és un reemplaçament de HDFS,,en,HBase és una base de dades NoSQL i funciona a la part superior de HDFS,,en,En algun moment la gent pensa que HBase és un substitut o substitut del HDFS,,en,Però són fonamentalment diferents,,en,és un emmagatzematge distribuït que s'estén al llarg de diversos maquinari de productes bàsics,,en,És el sistema de fitxers Hadoop i funciona com a emmagatzematge genèric per a qualsevol tipus d'aplicació Hadoop,,en,Però HBase és una base de dades no relacional que utilitza,,en,com a emmagatzematge per mantenir les seves dades,,en,Es pot comparar amb qualsevol base de dades relacional i el seu emmagatzematge en un sistema de fitxers normal / local,,en, HBase also supports REST-ful web services, jruby-based shell, Ganglia and JMX. So, HBase has a very strong presence in NoSQL database world.


Is HBase a replacement of HDFS?

HBase is a NoSQL data base and it works on top of HDFS. So, sometime people think that HBase is a replacement or substitute for HDFS. But they are fundamentally different. HDFS is a distributed storage which spans across multiple commodity hardware. It is the Hadoop file system and works as a generic storage for any type of Hadoop application. But HBase is a non-relational database which uses HDFS as storage for keeping its data. It can be compared with any relational database and its storage in normal/local file system. Per tant, podem concloure que HBase no és un reemplaçament, sinó que treballen conjuntament i es complementen,,en,També podeu consultar,,en,Introducció a NoSQL,,en,Llegeix més articles interessants sobre NoSQL DB,,en,Com funciona HBase,,en,Les escales HBase d'una manera lineal,,en,de manera que totes les taules han de tenir una clau principal,,en,Tots els espais clau es distribueixen en blocs seqüencials i aquests blocs estan assignats a regions,,en,aquestes regions estan controlades per,,en,RegionServers,,en,per distribuir la càrrega de manera uniforme en un entorn en clúster,,en,HBase és compatible amb dades automàtiques,,en,de manera que no es requereix intervenció manual,,en,Després d'implementar HBase,,en,HMaster,,en,Els servidors estan configurats per proporcionar informació de topologia de clúster als clients HBase,,en,Les aplicacions de client es connecten a aquestes utilitats i obtenen les llistes de RegionServers,,en,regions i informació sobre els intervals clau,,en.

You can also check Introduction to NoSQL

Read more interesting articles on NoSQL DB

How HBase works?

HBase scales in a linear way, so all the tables should have a primary key. All the key spaces are distributed into sequential blocks and these blocks are allotted to regions. Now, these regions are controlled by RegionServers to distribute the load uniformly in a clustered environment. HBase supports automatic data sharding, so manual intervention is not required.

After deploying HBase, Zookeeper i HMaster servers are configured to provide cluster topology information to the HBase clients. Client applications connect to these utilities and get the lists of RegionServers, regions and key ranges information. Ajuda al client a conèixer la posició exacta de les dades i connectar-se directament a RegionServer,,en,RegionServers també proporciona caché,,en,utilitzant memstore,,en,suport per a files freqüentment accessibles,,en,Millora el rendiment,,en,Components Apache Hadoop,,en,Quins són els serveis de suport,,en,Si estem convençuts de seleccionar HBase com la base de dades NoSQL per a la nostra aplicació,,en,llavors també hem de recordar el requisit de donar suport als serveis,,en,Només la implementació d'HBase no servirà la imatge completa,,en,El servei de suport més important és el servei de coordinació en l'entorn distribuït,,en,és la millor utilitat de coordinació utilitzada amb HBase,,en,L'altra part important del servei és l'àrea de xarxa,,en,Els serveis de xarxa com ara NTP i DNS han d'estar al seu lloc per ajudar a facilitar la sincronització entre els diferents nodes,,en. RegionServers also provide caching (by using memstore) support for frequently accessed rows. It improves the performance.

You may like to read Apache Hadoop components

What are the supporting services?

If we are convinced to select HBase as the NoSQL data base for our application, then we must remember the requirement of supporting services also. Only HBase implementation will not serve the complete picture. The most important supporting service is the coordination service in the distributed environment. Zookeeper is the best coordination utility used with HBase. The other important service part is the networking area. Network services like NTP and DNS should be in place to help smooth synchronization among different nodes. HBase es distribueix en un entorn en clúster,,en,per la qual cosa ha d'estar correctament connectat amb els serveis de coordinació,,en,NTP,,en,Protocol de temps de xarxa,,en,és un protocol de xarxa per sincronitzar els temps de rellotge entre els diferents sistemes connectats,,en,A mesura que HBase es distribueix entre nodes,,en,la sincronització del rellotge és molt important mentre es fa referència entre si,,en,El DNS,,en,juntament amb NTP asseguren un funcionament suau i eficaç d'HBase,,en,Per tant, podem comprendre que la supervisió és el servei més important mentre es desplega HBase,,en,Tots els nodes s'han de controlar per a l'ús de la CPU,,en,latència,,en,Activitats d'E / S i ample de banda,,en,Després de passar per les seccions anteriors,,en,tenim alguna idea sobre HBase,,en,També coneixem els serveis de suport i les consideracions clau per a la implementació d'HBase,,en,Com a DB NoSQL,,en,HBase ofereix moltes bones funcionalitats,,en, so it should be properly networked with coordination services. NTP (Network Time Protocol) is a network protocol for synchronizing clock timings between different connected systems. As HBase is distributed among nodes, the clock synchronization is very important while referring each other. The DNS (Domain Name System) along with NTP ensures smooth and efficient functioning of HBase.

So we can understand that monitoring is the most important service while deploying HBase. Each and every node should be monitored for CPU usage, latency, I/O activities and bandwidth.








When should you use HBase?

After going through the above sections, we have got some idea about HBase. We also know the supporting services and the key considerations for HBase deployment. As a NoSQL DB, HBase offers lot of good functionalities, però encara no és el,,en,'Fit for All,,en,A continuació es detallen algunes de les àrees clau a considerar abans de finalitzar l'HBase per a la seva aplicació,,en,Volum de dades,,en,El volum de dades és el punt més habitual a considerar,,en,Hauríeu d'haver-hi pics de dades per processar en un entorn distribuït,,en,per una petita quantitat de dades,,en,serà emmagatzemat i processat en un únic node,,en,mantenint altres nodes inactius,,en,Així doncs, serà un mal ús del marc tecnològic,,en,Tipus d'aplicació,,en,HBase no és adequat per a aplicacions transaccionals,,en,gran volum,,en,treballs,,en,anàlisi relacional, etc.,,en,És preferit quan teniu un esquema variable amb files lleugerament diferents,,en,També és adequat quan es dirigeix ​​a una clau depenent de l'accés a les dades emmagatzemades,,en,Entorn de maquinari,,en,HBase funciona amb HDFS,,en ‘Fit for All’ solució. Following are some of the key areas to be considered before finalizing HBase for your application.

Data volume: The volume of data is the most common point to be considered. You should have peta bytes of data to be processed in a distributed environment. D'una altra manera, for small amount of data, it will be stored and processed in a single node, keeping other nodes idle. So it will be a misuse of technology framework.

Application Types: HBase is not suitable for transactional applications, large volume MapReduce jobs, relational analytics etc. It is preferred when you have variable schema with slightly different rows. It is also suitable when you are going for a key dependent access to your stored data.

Hardware environment: HBase runs on top of HDFS. I HDFS funciona de forma eficient amb gran nombre de nodes,,en,si teniu un bon suport de maquinari,,en,llavors HBase pot ser una bona selecció,,en,No hi ha requisit de característiques relacionals,,en,La vostra aplicació no hauria de tenir cap requisit per a les funcions RDBMS com la transacció,,en,desencadenants,,en,unions complexes, etc,,en,Si podeu crear la vostra aplicació sense aquestes funcions, aneu a HBase,,en,Accés ràpid a les dades,,en,Si necessiteu un accés aleatori i en temps real a les vostres dades, HBase és un candidat adequat,,en,També és un ajustament perfecte per emmagatzemar taules grans amb dades multiestructurades,,en,Dóna un "flashback",,en,suport a consultes,,en,la qual cosa la fa més adequada per obtenir dades en una instància particular de temps,,en,HBase també és adequat quan necessiteu tolerants a errors,,en,gestió de dades ràpida i usable en un entorn no relacional,,en (minimum 5). So, if you have good hardware support, then HBase can be a good selection.

No requirement of relational features: Your application should not have any requirement for RDBMS features like transaction, triggers, complex query, complex joins etc. If you can build your application without these features then go for HBase.

Quick access to data: If you need a random and real time access to your data then HBase is a suitable candidate. It is also a perfect fit for storing large tables with multi structured data. It gives ‘flashback’ support to queries, which makes it more suitable for fetching data in a particular instance of time.

Apart from the above points, HBase is also suitable when you need fault tolerant, fast and usable data management in a non-relational environment.








Quins són els progressos recents en HBase,,en,A continuació es mostren algunes de les recents millores en HBase,,en,Millora d'alta disponibilitat,,en,Integració de HBase i fils,,en,Compressió de bloqueig de bloqueig,,en,Suport als tipus de dades,,en,Suport a millores actualitzades,,en,Alguns casos d'ús,,en,Hi ha moltes implementacions de HBase en la vida real,,en,Alguns dels casos d'ús són importants,,en,Ús de HBase per part de Mozilla,,en,Generalment emmagatzema totes les dades de fallades a HBase,,en,Ús de HBase per Facebook,,en,Facebook utilitza l'emmagatzematge de HBase per emmagatzemar missatges en temps real,,en,Al llarg d'aquest article,,en,hem parlat sobre diferents característiques de HBase,,en,la seva metodologia de treball i les àrees d'implementació,,en,També hem comprovat les millores recents i alguns dels casos d'ús,,en,podem concloure que HBase és una base de dades clau de valor NoSQL i un bon adaptador per a consultes en temps real,,en,HBase juntament amb els seus productes de sistema ecològic,,en?

Following are some of the recent improvements in HBase.

  • Improved high availability
  • HBase and YARN integration
  • Blockcache compression
  • Support to data types
  • Support to rolling upgrades

Some use cases

There are a lot of real-life implementations of HBase. Some of the important use cases are

  • Use of HBase by Mozilla: They generally stores all crashes data in HBase
  • Use of HBase by Facebook: Facebook uses HBase storage to store real-time messages.

Conclusió

Throughout this article, we have discussed different features of HBase, its working methodology and the implementation areas. We have also checked the recent improvements and some of the use cases. In short, we can conclude that HBase is a key-value NoSQL database and a good fit for real-time queries. So, HBase along with its eco-system products (com Zookeeper,,en,HMaster, etc.,,en,pot ser una solució completa per a les implementacions de NoSQL,,en,abans de finalitzar,,en,hem d'avaluar-la basant-nos en el requisit de l'aplicació,,en,Llegiu més sobre,,en,techalpine.com/exploring-base-nosql-db,,en, HMaster etc.) can be a complete solution for NoSQL deployments. But again, before finalizing, we should evaluate it based on the application requirement.

Read more about Apache HBase

iptv, iptv system, iptv solution

============================================= ============================================== Buy best TechAlpine Books on Amazon
============================================== ---------------------------------------------------------------- electrician ct chestnutelectric
error

Enjoy this blog? Please spread the word :)

Follow by Email
LinkedIn
LinkedIn
Share