Hadoop setup në nyje të vetme dhe multi nyjen

Ne do të përshkruajë organizim Hadoop në nyjen e vetme dhe multi nyje. The Hadoop environment setup and configuration will be described in details. Së pari ju duhet të shkarkoni software e mëposhtme (rpm).

Java JDK RPM
Apache Hadoop 0.20.204.0 RPM

Një) Vetëm sistemi nyje Hadoop Setup

1) Instalo JDK në Red Hat ose CentOS 5+ sistem.

$ ./JDK-6u26-linux-x64-rpm.bin.sh

Java është instaluar dhe të vendosur për të JAVA_HOME / usr / Java / Default

2) Install Apache Hadoop 0.20.204.

$ rpm-i hadoop-0.20.204.0-1.i386.rpm

3) Setup Apache Hadoop konfigurimit dhe të fillojnë proceset Hadoop.

$ /usr / sbin / hadoop-organizim-vetme-node.sh

Asistenti i konfigurimit do t'ju udhëheq përmes një listë të pyetjeve të setup Hadoop. Hadoop duhet të konkurrojnë, pasi iu përgjigjur 'Y' të gjitha pyetjeve.

Krijo një llogari përdoruesi në HDFS për veten.

$ /usr / sbin / hadoop-krijoni-user.sh-u $ USER

B) Multi-nyjet Setup Hadoop

1) Install dy JDK dhe Hadoop 0.20.204.0 RPMs në të gjitha nyjet

2) Generate konfigurimin hadoop në të gjitha nyjet:

$ /usr / sbin / hadoop-Setup-conf.sh \

  --namenode-URL = hdfs://${namenode}:9000/ \

  --jobtracker url = ${jobtracker}:9001 \

  --conf-dir = / etc / Hadoop \

  --hdfs-Dir = / var / lib / Hadoop / hdfs \

  --namenode-dir = / var / lib / Hadoop / hdfs / namenode \

  --mapred-dir = / var / lib / Hadoop / mapred \

  --DataNode-dir = / var / lib / Hadoop / HDFS / data \

  --log-dir = / var / log / Hadoop \

  --auto

Ku ${namenode} dhe ${jobtracker} duhet të zëvendësohet me hostname e namenode dhe jobtracker.

3) Format namenode dhe setup parazgjedhur HDFS Layout.

$ /usr / sbin / hadoop-Setup-hdfs.sh

4) Filloni të gjitha nyjet dhënave.

$ /etc / init.d / hadoop-datanode Fillimi

5) Të fillojë punë nyje tracker.

$ /etc / init.d / hadoop-jobtracker Fillimi

6) Filloni nyjet tracker detyrë.

$ /etc / init.d / Hadoop-detyrë tracker starter

7) Krijo një llogari përdoruesi në HDFS për veten.

$ /usr / sbin / hadoop-krijoni-user.sh-u $ USER

C) Mjedisi Setup për Hadoop

$ Unë ~ /. Bash_profile

Në insert mode rrugën vendosur për JAVA_HOME

Eksporti JAVA_HOME

Ruaj skedarin duke klikuar ESC:wq

Run bash_profile.

$ burim ~ /. bash_profile

Set rrugën JAVA_HOME në dosjen Hadoop Mjedisit

$ /etj / Hadoop / Hadoop-env.sh

D) Konfigurimi për Hadoop

Përdorin poshtë:

Conf / core-site.xml:

<pronë>

<emër>fs.default.name</emër>

<vlerë>hdfs://localhost:9000</vlerë>

</pronë>

</konfiguracion>

Conf / hdfs-site.xml:

<pronë>

<emër>dfs.replication</emër>

<vlerë>1</vlerë>

</pronë>

</konfiguracion>

Conf / mapred-site.xml:

<pronë>

<emër>mapred.job.tracker</emër>

<vlerë>localhost:9001</vlerë>

</pronë>

</konfiguracion>

Ajo) Komandat Hadoop

$ hadoop
$ hadoop namenode-format (Format e namenode, Nëse kërkoni të
përgjigjet për shtyp 'Y')
$ hadoop namenode (Filloni namenode)
$ gjej / -emër fillim-dfs.sh (gjeni fotografi në directory)
$ usr cd / sbin (Shko tek directory përkatës direkt)
$ start-dfs.sh
$ start-mapred.sh

$ hadoop fs-ls / (Tregon dosjen rrënjë HDFS)
$ hadooop fs-vënë input/file01 / input/file01 (Kopjo input/file01 lokale në
HDFS root / input/file01)

Share on Facebook

Save

Tagged në: Big Data

TechAlpine – All About Technology

www.techalpine.com

Si për të ngritur Hadoop në nyjen e vetme dhe multi nyjeve?

Enjoy this blog? Please spread the word :)