Khám phá HBase NoSQL DB,en

HBase NoSQL DB

HBase NoQuery DB,,en,Khám phá các tính năng,,en,là một trong những cơ sở dữ liệu phi quan hệ phổ biến nhất được xây dựng trên đầu trang,,en,và HDFS,,en,DB được viết bằng ngôn ngữ Java,,en,Nó được xây dựng bằng cách theo dõi Google Google,,en,Cái bàn lớn,,en,các khái niệm,,en,Apache HBase phù hợp cho các trường hợp sử dụng khi bạn cần thời gian thực và quyền truy cập đọc / ghi ngẫu nhiên vào khối lượng dữ liệu khổng lồ,,en,Khi HBase chạy trên đỉnh,,en,hiệu suất cũng phụ thuộc vào hỗ trợ phần cứng,,en,Chúng tôi cần cung cấp đủ số lượng nút,,en,tối thiểu,,en,để có được một hiệu suất tốt hơn,,en,chúng ta sẽ khám phá các khía cạnh khác nhau của HBase và khả năng ứng dụng của nó,,en,Các tính năng của Hbase NoQuery DB là gì,,en,Apache HBase là một cơ sở dữ liệu hướng theo cột hỗ trợ lược đồ cơ sở dữ liệu động,,en,Nó chủ yếu chạy trên HDFS và hỗ trợ các công việc MapReduce,,en,HBase cũng hỗ trợ các ngôn ngữ cấp cao khác để xử lý dữ liệu,,en – Exploring features

Tổng quan: Apache HBase is one of the most popular non-relational databases built on top of Hadoop and HDFS (Hadoop Distributed File system). It is also known as Hadoop database. As an Apache project, HBase is an open-source, versioned and distributed NoSQL DB written in Java language. It is built by following Google’s Bigtable concepts. Apache HBase is suitable for use cases where you need real time and random read/write access to huge volume of data (Dữ liệu lớn). As HBase runs on top of HDFS, the performance is also dependent on the hardware support. We need to provide sufficient number of nodes (minimum 5) to get a better performance.

Trong bài viết này, we will explore different aspects of HBase and its applicability.








What are the features of Hbase NoSQL DB?

Apache HBase is a column oriented database which supports dynamic database schema. It mainly runs on top of HDFS and supports MapReduce jobs. HBase also supports other high level languages for data processing.

Chúng ta hãy xem xét các tính năng khác nhau của HBase như được đề cập dưới đây,,en,HBase hỗ trợ khả năng mở rộng ở cả dạng tuyến tính và mô đun,,en,Shending,,en,HBase hỗ trợ tự động sắp xếp các bảng,,en,Nó cũng có thể cấu hình,,en,Lưu trữ phân tán,,en,HBase hỗ trợ lưu trữ phân tán như HDFS,,en,Nó hỗ trợ các hoạt động đọc và ghi nhất quán,,en,Hỗ trợ chuyển đổi dự phòng,,en,HBase hỗ trợ chuyển đổi dự phòng tự động,,en,Hỗ trợ API,,en,HBase hỗ trợ API Java để khách hàng có thể truy cập dễ dàng,,en,Hỗ trợ MapReduce,,en,Hỗ trợ HBase,,en,để xử lý song song khối lượng lớn dữ liệu,,en,Hỗ trợ sao lưu,,en,HBase hỗ trợ sao lưu Hadoop,,en,công việc trong bảng HBase,,en,Xử lý thời gian thực,,en,Nó hỗ trợ bộ đệm khối và bộ lọc Bloom,,en,Vì vậy, xử lý truy vấn thời gian thực là dễ dàng,,en,Ngoài các tính năng chính trên,,en,HBase cũng hỗ trợ,,en,Dịch vụ web REST-Ful,,en,vỏ dựa trên jruby,,en,Ganglia và JMX,,en.

Scalability: HBase supports scalability in both linear and modular form

Sharding: HBase supports automatic sharding of tables. It is also configurable.

Distributed storage: HBase supports distributed storage like HDFS

Consistency: It supports consistent read and write operations

Failover support: HBase supports automatic failover

API support: HBase supports Java APIs so clients can access it easily

MapReduce support: HBase supports MapReduce for parallel processing of large volume of data

Back up support: HBase supports back up of Hadoop MapReduce jobs in HBase tables

Real time processing: It supports block cache and Bloom filters. So real time query processing is easy

Apart from the above major features, HBase also supports REST-ful web services, jruby-based shell, Ganglia and JMX. So, HBase có sự hiện diện rất mạnh mẽ trong thế giới cơ sở dữ liệu NoQuery,,en,HBase có phải là sự thay thế của HDFS không,,en,HBase là một cơ sở dữ liệu NoQuery và nó hoạt động trên đỉnh HDFS,,en,đôi khi mọi người nghĩ rằng HBase là sự thay thế hoặc thay thế cho HDFS,,en,Nhưng về cơ bản chúng khác nhau.,,en,là một bộ lưu trữ phân tán trải rộng trên nhiều phần cứng hàng hóa,,en,Đây là hệ thống tệp Hadoop và hoạt động như một bộ lưu trữ chung cho mọi loại ứng dụng Hadoop,,en,Nhưng HBase là một cơ sở dữ liệu không liên quan, sử dụng,,en,như lưu trữ để giữ dữ liệu của nó,,en,Nó có thể được so sánh với bất kỳ cơ sở dữ liệu quan hệ và lưu trữ của nó trong hệ thống tệp bình thường / cục bộ,,en,Vì vậy, chúng ta có thể kết luận rằng HBase không phải là sự thay thế nhưng chúng hoạt động cùng nhau và bổ sung cho nhau,,en,Bạn cũng có thể kiểm tra,,en,Giới thiệu về NoQuery,,en,Đọc thêm các bài viết thú vị về NoQuery DB,,en.


Is HBase a replacement of HDFS?

HBase is a NoSQL data base and it works on top of HDFS. So, sometime people think that HBase is a replacement or substitute for HDFS. But they are fundamentally different. HDFS is a distributed storage which spans across multiple commodity hardware. It is the Hadoop file system and works as a generic storage for any type of Hadoop application. But HBase is a non-relational database which uses HDFS as storage for keeping its data. It can be compared with any relational database and its storage in normal/local file system. So we can conclude that HBase is not a replacement but they work together and complement each other.

You can also check Introduction to NoSQL

Read more interesting articles on NoSQL DB

How HBase works?

HBase scales in a linear way, so all the tables should have a primary key. All the key spaces are distributed into sequential blocks and these blocks are allotted to regions. Now, these regions are controlled by RegionServers to distribute the load uniformly in a clustered environment. HBase supports automatic data sharding, so manual intervention is not required.

After deploying HBase, Zookeeper HMaster servers are configured to provide cluster topology information to the HBase clients. Client applications connect to these utilities and get the lists of RegionServers, regions and key ranges information. It helps the client to know exact data position and connect to RegionServer directly. RegionServers also provide caching (by using memstore) support for frequently accessed rows. It improves the performance.

You may like to read Apache Hadoop components

Các dịch vụ hỗ trợ là gì,,en,Nếu chúng tôi bị thuyết phục chọn HBase làm cơ sở dữ liệu NoQuery cho ứng dụng của chúng tôi,,en,sau đó chúng ta phải nhớ yêu cầu của dịch vụ hỗ trợ,,en,Chỉ thực hiện HBase sẽ không phục vụ bức tranh hoàn chỉnh,,en,Dịch vụ hỗ trợ quan trọng nhất là dịch vụ phối hợp trong môi trường phân tán,,en,là tiện ích phối hợp tốt nhất được sử dụng với HBase,,en,Phần dịch vụ quan trọng khác là khu vực kết nối mạng,,en,Cần có các dịch vụ mạng như NTP và DNS để giúp đồng bộ hóa trơn tru giữa các nút khác nhau,,en,HBase được phân phối trong một môi trường cụm,,en,vì vậy nó cần được kết nối đúng cách với các dịch vụ phối hợp,,en,NTP,,en,Giao thức thời gian mạng,,en,là một giao thức mạng để đồng bộ hóa thời gian của đồng hồ giữa các hệ thống được kết nối khác nhau,,en,Vì HBase được phân phối giữa các nút,,en?

If we are convinced to select HBase as the NoSQL data base for our application, then we must remember the requirement of supporting services also. Only HBase implementation will not serve the complete picture. The most important supporting service is the coordination service in the distributed environment. Zookeeper is the best coordination utility used with HBase. The other important service part is the networking area. Network services like NTP and DNS should be in place to help smooth synchronization among different nodes. HBase is distributed in a clustered environment, so it should be properly networked with coordination services. NTP (Network Time Protocol) is a network protocol for synchronizing clock timings between different connected systems. As HBase is distributed among nodes, đồng bộ hóa rất quan trọng trong khi giới thiệu lẫn nhau,,en,DNS,,en,cùng với NTP đảm bảo hoạt động trơn tru và hiệu quả của HBase,,en,Vì vậy, chúng ta có thể hiểu rằng giám sát là dịch vụ quan trọng nhất trong khi triển khai HBase,,en,Mỗi và mọi nút nên được theo dõi để sử dụng CPU,,en,độ trễ,,en,Hoạt động I / O và băng thông,,en,Sau khi đi qua các phần trên,,en,chúng tôi đã có một số ý tưởng về HBase,,en,Chúng tôi cũng biết các dịch vụ hỗ trợ và những cân nhắc chính cho việc triển khai HBase,,en,Là một DB NoQuery,,en,HBase cung cấp nhiều chức năng tốt,,en,nhưng nó vẫn không phải là,,en,Phù hợp với tất cả,,en,Sau đây là một số lĩnh vực chính cần được xem xét trước khi hoàn thiện HBase cho ứng dụng của bạn,,en,Khối lượng dữ liệu,,en,Khối lượng dữ liệu là điểm phổ biến nhất được xem xét,,en. The DNS (Hệ Thống Tên Miền) along with NTP ensures smooth and efficient functioning of HBase.

So we can understand that monitoring is the most important service while deploying HBase. Each and every node should be monitored for CPU usage, latency, I/O activities and bandwidth.








When should you use HBase?

After going through the above sections, we have got some idea about HBase. We also know the supporting services and the key considerations for HBase deployment. As a NoSQL DB, HBase offers lot of good functionalities, but it is still not the ‘Fit for All’ solution. Following are some of the key areas to be considered before finalizing HBase for your application.

Data volume: The volume of data is the most common point to be considered. Bạn nên xử lý các byte dữ liệu peta trong môi trường phân tán,,en,cho một lượng nhỏ dữ liệu,,en,nó sẽ được lưu trữ và xử lý trong một nút,,en,giữ cho các nút khác không hoạt động,,en,Vì vậy, nó sẽ là một lạm dụng của khung công nghệ,,en,Các loại ứng dụng,,en,HBase không phù hợp cho các ứng dụng giao dịch,,en,khối lượng lớn,,en,việc làm,,en,phân tích quan hệ, vv,,en,Nó được ưa thích khi bạn có lược đồ biến với các hàng hơi khác nhau,,en,Nó cũng phù hợp khi bạn đang truy cập khóa phụ thuộc vào dữ liệu được lưu trữ của bạn,,en,Môi trường phần cứng,,en,HBase chạy trên đỉnh HDFS,,en,Và HDFS hoạt động hiệu quả với số lượng lớn các nút,,en,nếu bạn có hỗ trợ phần cứng tốt,,en,thì HBase có thể là một lựa chọn tốt,,en,Không yêu cầu các tính năng quan hệ,,en,Ứng dụng của bạn không nên có bất kỳ yêu cầu nào đối với các tính năng RDBMS như giao dịch,,en,gây nên,,en. Otherwise, for small amount of data, it will be stored and processed in a single node, keeping other nodes idle. So it will be a misuse of technology framework.

Application Types: HBase is not suitable for transactional applications, large volume MapReduce jobs, relational analytics etc. It is preferred when you have variable schema with slightly different rows. It is also suitable when you are going for a key dependent access to your stored data.

Hardware environment: HBase runs on top of HDFS. And HDFS works efficiently with large number of nodes (minimum 5). So, if you have good hardware support, then HBase can be a good selection.

No requirement of relational features: Your application should not have any requirement for RDBMS features like transaction, triggers, complex query, tham gia phức tạp vv,,en,Nếu bạn có thể xây dựng ứng dụng của mình mà không có các tính năng này thì hãy tìm HBase,,en,Truy cập nhanh vào dữ liệu,,en,Nếu bạn cần truy cập ngẫu nhiên và theo thời gian thực vào dữ liệu của mình thì HBase là một ứng cử viên phù hợp,,en,Nó cũng là một sự phù hợp hoàn hảo để lưu trữ các bảng lớn với dữ liệu đa cấu trúc,,en,Nó cho ‘hồi tưởng,,en,hỗ trợ truy vấn,,en,làm cho nó phù hợp hơn để tìm nạp dữ liệu trong một trường hợp cụ thể của thời gian,,en,HBase cũng phù hợp khi bạn cần dung sai,,en,quản lý dữ liệu nhanh và có thể sử dụng trong môi trường không liên quan,,en,Những tiến bộ gần đây trong HBase là gì,,en,Sau đây là một số cải tiến gần đây trong HBase,,en,Cải thiện tính sẵn sàng cao,,en,Tích hợp HBase và YARN,,en,Nén khối,,en,Hỗ trợ các kiểu dữ liệu,,en,Hỗ trợ nâng cấp cán,,en,Một số trường hợp sử dụng,,en. If you can build your application without these features then go for HBase.

Quick access to data: If you need a random and real time access to your data then HBase is a suitable candidate. It is also a perfect fit for storing large tables with multi structured data. It gives ‘flashback’ support to queries, which makes it more suitable for fetching data in a particular instance of time.

Apart from the above points, HBase is also suitable when you need fault tolerant, fast and usable data management in a non-relational environment.








What are the recent progresses in HBase?

Following are some of the recent improvements in HBase.

  • Improved high availability
  • HBase and YARN integration
  • Blockcache compression
  • Support to data types
  • Support to rolling upgrades

Some use cases

Có rất nhiều triển khai HBase trong đời thực,,en,Một số trường hợp sử dụng quan trọng là,,en,Sử dụng HBase của Mozilla,,en,Họ thường lưu trữ tất cả dữ liệu sự cố trong HBase,,en,Sử dụng HBase của Facebook,,en,Facebook sử dụng lưu trữ HBase để lưu trữ tin nhắn thời gian thực,,en,Xuyên suốt bài viết này,,en,chúng tôi đã thảo luận về các tính năng khác nhau của HBase,,en,phương pháp làm việc của nó và các lĩnh vực thực hiện,,en,Chúng tôi cũng đã kiểm tra các cải tiến gần đây và một số trường hợp sử dụng,,en,chúng ta có thể kết luận rằng HBase là một cơ sở dữ liệu NoQuery có giá trị khóa và phù hợp với các truy vấn thời gian thực,,en,HBase cùng với các sản phẩm hệ sinh thái của nó,,en,như Zookeeper,,en,Vv,,fr,có thể là một giải pháp hoàn chỉnh cho việc triển khai NoQuery,,en,trước khi hoàn thiện,,en,chúng ta nên đánh giá nó dựa trên yêu cầu ứng dụng,,en,Đọc thêm về,,en,techalpine.com/exploring-hbase-nosql-db,,en. Some of the important use cases are

  • Use of HBase by Mozilla: They generally stores all crashes data in HBase
  • Use of HBase by Facebook: Facebook uses HBase storage to store real-time messages.

Kết luận

Throughout this article, we have discussed different features of HBase, its working methodology and the implementation areas. We have also checked the recent improvements and some of the use cases. In short, we can conclude that HBase is a key-value NoSQL database and a good fit for real-time queries. So, HBase along with its eco-system products (like Zookeeper, HMaster etc.) can be a complete solution for NoSQL deployments. But again, before finalizing, we should evaluate it based on the application requirement.

Read more about Apache HBase

iptv, iptv system, iptv solution

============================================= ============================================== Mua sách Techalpine tốt nhất trên Amazon,en,Thợ điện CT Hạt dẻ,en
============================================== ---------------------------------------------------------------- electrician ct chestnutelectric
error

Thưởng thức blog này,,en,làm ơn mở rộng vốn từ,,en,techalpine.com/apache-mahout-and-machine-learning,,en? Please spread the word :)

Follow by Email
LinkedIn
LinkedIn
Share