What do you mean by Map-Reduce programming? MapReduce is a programming model designed for processing large volumes of data in parallel by dividing the work into a set of independent tasks. The MapReduce programming model is inspired by functional languages…
Cómo configurar Hadoop en un nodo único nodo y multi-?
Vamos a describir la configuración Hadoop en un solo nodo y el nodo de múltiples. The Hadoop environment setup and configuration will be described in details. En primer lugar es necesario descargar el software siguiente (rpm). Java JDK RPM Apache Hadoop 0.20.204.0 RPM A) Single…
¿Qué es Apache Sqoop y cómo usarlo para importar / exportar datos de Hadoop Sistema de archivos distribuido?
Apache Sqoop es una herramienta utilizada para la transferencia de datos desde / al sistema de archivos distribuido Hadoop. Hadoop arquitectura puede procesar grandes volúmenes de datos y almacenarla en HDFS. But if we want to use that data then we need to use some tool…
¿Qué es Hadoop Streaming?
Años : Hadoop streaming es una potente utilidad que viene con Hadoop distribution.The concepto básico del marco Hadoop es dividir el trabajo,process it in parallel and then join it back to get the end result.So there are two main…
¿Qué es el Mapa / Reducir en Hadoop?
Años : Procesamiento gran cantidad de datos (multi-terabyte conjuntos de datos) es una de las principales preocupaciones en la vida real projects.As el tamaño de los datos está aumentando día a día, aplicaciones tienen dificultades para procesar de forma fiable,secured and fault-tolerant way.…