Преглед: There are a bunch of working definitions for Big Data yet to me it is put as data collection so substantial and complex that it ends up troublesome or difficult to process those utilizing conventional databases. For a little…
Big Data: Големи лоши данни или промяна на играта,en
Преглед: Data is evolving everywhere- from a single voice search you just made to locate a nearby restaurant in your neighbor to the last weekend’s party pictures which you just threw over Facebook account. “A report reveals that 2.5 quintillion…
Why Apache Spark is the future platform for big data?
Преглед: As big data becomes one of the most important assets an enterprise can possess, enterprises are demanding more out of the data. Enterprises expect data to provide complex and multidimensional insights at high speeds. To provide such insights, companies…
Exploring HBase NoSQL DB
Преглед: Apache HBase is one of the most popular non-relational databases built on top of Hadoop and HDFS (Hadoop Distributed File system). It is also known as Hadoop database. As an Apache project, HBase is an open-source, versioned and distributed…
Apache Pig and Hadoop platform – How to process your data?
Преглед: Apache Pig is a high level scripting language and a part of Apache Hadoop Eco-system. Pig scripting is mainly used for data analysis and manipulation on top of Hadoop platform. We know that MapReduce is a programming model used…
Hadoop Basic concepts – Learn it now
Въвеждане: In this series, we will discuss some of the basic concepts in Hadoop and big data. We have tried to cover basic concepts and explain them to make it easy to learn and implement. We will keep on adding…
Steps to work with Windows Azure HDInsight
Преглед: Hadoop has made big data handling simpler and it goes without saying that in the context of the huge importance big data is being given, Hadoop is viewed as a key tool in big data management. However, organizations might…
режими за монтаж Hadoop - Да опознаем
Преглед: Apache Hadoop могат да бъдат инсталирани в различни режими, както на изискването. Тези различни режими са конфигурирани по време на инсталацията. По подразбиране, Hadoop е инсталиран в Standalone режим. Другите видове са Псевдо разпределени режим и режим разпределени. Целта…
Какво е HDFS федерация?
Преглед: Ние сме добре запознати с особеностите на Hadoop и HDFS. В този документ, ние ще говорим за федерацията HDFS което ни помага да се подобри съществуващата HDFS архитектура. It provides a clear separation between namespace and storage…
What is Spring for Apache Hadoop?
Преглед: Пролетта е един от най-широко използваните рамки в развитието на бизнес приложения. Spring има различни компоненти като Spring ORM, Spring JDBC и т.н., за да поддържа различни функции. Пролет за Apache Hadoop е рамката да подкрепя изграждането на заявление с Hadoop компоненти…
Какви са новите тенденции в големи данни и анализи?
Преглед: Big технология данни идва с най-добрите практики и по-добри тенденции всеки ден. Big данни постепенно влизат в основните проекти по веригата също и набира скорост. С голям данни, Анализ също се получават много по важност, както е…
What is Hadoop distributed file system (HDFS)?
Преглед: In this article I will discuss about HDFS, which is the underlying file system of Apache Hadoop framework. Hadoop Distributed File System (HDFS) is a distributed storage space that spans across thousands of commodity hardware. Тази файлова система осигурява…
How Hadoop Streaming works?
Преглед: Hadoop streaming is one of the most important utility in Hadoop distribution. The Streaming interface of Hadoop allows you to write Map-Reduce program in any language of your choice, which can work with STDIN and STDOUT. So, Streaming може…