Přehled: There are a bunch of working definitions for Big Data yet to me it is put as data collection so substantial and complex that it ends up troublesome or difficult to process those utilizing conventional databases. For a little…
Big Data: Velké špatné údaje nebo herní měnič,en
Přehled: Data is evolving everywhere- from a single voice search you just made to locate a nearby restaurant in your neighbor to the last weekend’s party pictures which you just threw over Facebook account. “A report reveals that 2.5 quintillion…
Why Apache Spark is the future platform for big data?
Přehled: As big data becomes one of the most important assets an enterprise can possess, enterprises are demanding more out of the data. Enterprises expect data to provide complex and multidimensional insights at high speeds. To provide such insights, companies…
Exploring HBase NoSQL DB
Přehled: Apache HBase is one of the most popular non-relational databases built on top of Hadoop and HDFS (Hadoop Distributed File system). It is also known as Hadoop database. As an Apache project, HBase is an open-source, versioned and distributed…
Apache Pig and Hadoop platform – How to process your data?
Přehled: Apache Pig is a high level scripting language and a part of Apache Hadoop Eco-system. Pig scripting is mainly used for data analysis and manipulation on top of Hadoop platform. We know that MapReduce is a programming model used…
Hadoop Basic concepts – Learn it now
Úvod: In this series, we will discuss some of the basic concepts in Hadoop and big data. We have tried to cover basic concepts and explain them to make it easy to learn and implement. We will keep on adding…
Kroky pro práci s Windows Azure HDInsight
Přehled: Hadoop učinil zpracování velkých objemů dat manipulace jednodušší a je samozřejmé, že v souvislosti s obrovskou důležitost je dána zpracování velkých objemů dat, Hadoop je považován za klíčový nástroj ve velkém správu dat. However, organizace by mohly…
Režimy instalace Hadoop - Pojďme prozkoumat
Přehled: Apache Hadoop může být instalován v různých režimech dle požadavku. Tyto různé režimy jsou konfigurovány během instalace. Ve výchozím stavu, Hadoop je nainstalován v samostatném režimu. Ostatní režimy jsou distribuovány Pseudo režim a režim distribuovány. Účel…
Co je HDFS federace?
Přehled: Jsme si dobře vědomi z rysů Hadoop a HDFS. V tomto dokumentu se budeme hovořit o federaci HDFS což nám pomáhá zlepšit stávající HDFS architekturu. Poskytuje jasné oddělení mezi názvů a skladování…
Co je Pružina pro Apache Hadoop?
Přehled: Jaro je jedním z nejpoužívanějších rámců ve vývoji podnikových aplikací. Jaro má různé komponenty jako Spring ORM, Spring JDBC atd podporovat různé funkce. Pružina pro Apache Hadoop je rámec určený k podpoře aplikací budova s komponenty Hadoop…
Jaké jsou nejnovější trendy v oblasti zpracování velkých objemů dat a analytiky?
Přehled: Big technologie Data přichází s osvědčenými postupy a lepší trendy každý den. Big Data se postupně dostává do hlavního proudu projektů také a nabírá na obrátkách. S velkým údajů, analytika je také stále velký význam, jak to je…
What is Hadoop distributed file system (HDFS)?
Přehled: In this article I will discuss about HDFS, which is the underlying file system of Apache Hadoop framework. Hadoop Distributed File System (HDFS) is a distributed storage space that spans across thousands of commodity hardware. Tento souborový systém poskytuje…
How Hadoop Streaming works?
Přehled: Hadoop streaming is one of the most important utility in Hadoop distribution. The Streaming interface of Hadoop allows you to write Map-Reduce program in any language of your choice, which can work with STDIN and STDOUT. So, Streaming může…