Übersicht: There are a bunch of working definitions for Big Data yet to me it is put as data collection so substantial and complex that it ends up troublesome or difficult to process those utilizing conventional databases. For a little…
Big Data: A Big Bad Data or a Game Changer
Übersicht: Data is evolving everywhere- from a single voice search you just made to locate a nearby restaurant in your neighbor to the last weekend’s party pictures which you just threw over Facebook account. “A report reveals that 2.5 quintillion…
Why Apache Spark is the future platform for big data?
Übersicht: As big data becomes one of the most important assets an enterprise can possess, enterprises are demanding more out of the data. Enterprises expect data to provide complex and multidimensional insights at high speeds. To provide such insights, companies…
Exploring HBase NoSQL DB
Übersicht: Apache HBase is one of the most popular non-relational databases built on top of Hadoop and HDFS (Hadoop Distributed File system). It is also known as Hadoop database. As an Apache project, HBase is an open-source, versioned and distributed…
Apache Pig and Hadoop platform – How to process your data?
Übersicht: Apache Pig is a high level scripting language and a part of Apache Hadoop Eco-system. Pig scripting is mainly used for data analysis and manipulation on top of Hadoop platform. We know that MapReduce is a programming model used…
Hadoop Basic concepts – Learn it now
Einführung: In this series, we will discuss some of the basic concepts in Hadoop and big data. We have tried to cover basic concepts and explain them to make it easy to learn and implement. We will keep on adding…
Die Schritte für die Arbeit mit Windows Azure HDInsight
Übersicht: Hadoop hat große Daten vereinfacht die Handhabung und es ist selbstverständlich, dass große Datenmengen im Rahmen der großen Bedeutung gegeben wird, Hadoop ist als ein wichtiges Instrument in großen Datenmanagement angesehen. Jedoch, Organisationen könnten…
Hadoop installation modes – Let’s explore
Übersicht: Apache Hadoop kann in verschiedenen Modi wie pro die Anforderung installiert werden. Diese unterschiedlichen Modi werden während der Installation konfiguriert. In der Standardeinstellung, Hadoop ist im Standalone-Modus installiert. Die anderen Modi sind Pseudo-Modus verteilt und verteilten Modus. Die Absicht…
Was ist HDFS Verband?
Übersicht: Wir sind uns bewusst, die Merkmale von Hadoop und HDFS. In diesem Dokument werden wir über die HDFS Föderation sprechen, die uns eine bestehende HDFS Architektur zu verbessern hilft. It provides a clear separation between namespace and storage…
Was ist Frühling für Apache Hadoop?
Übersicht: Spring is one of the widely used frameworks in enterprise applications development. Spring has different components like Spring ORM, Frühling JDBC usw. zu unterstützen verschiedene Funktionen. Spring for Apache Hadoop is the framework to support application building with Hadoop components…
Was sind die neuesten Trends in der großen Daten und Analysen?
Übersicht: Große Datentechnik wird jeden Tag mit Best Practices und Trends besser kommen. Big Daten kommt nach und nach in den Hauptstrom-Projekte auch und gewinnt an Dynamik. Mit großen Daten, Analytik ist auch viel Bedeutung bekommen, as it is…
What is Hadoop distributed file system (HDFS)?
Übersicht: In this article I will discuss about HDFS, which is the underlying file system of Apache Hadoop framework. Hadoop Distributed File System (HDFS) is a distributed storage space that spans across thousands of commodity hardware. This file system provides…
How Hadoop Streaming works?
Übersicht: Hadoop streaming is one of the most important utility in Hadoop distribution. The Streaming interface of Hadoop allows you to write Map-Reduce program in any language of your choice, which can work with STDIN and STDOUT. So, Streaming can…