Kako ustanoviti Hadoop na enem vozlišču vozlišče in več?

Opisali bomo Hadoop nastavitev na enem vozlišču vozlišče in več. The Hadoop environment setup and configuration will be described in details. Najprej morate prenesti naslednjo programsko opremo (min).

  • Java JDK RPM
  • Apache Hadoop 0.20.204.0 RPM

A) Enotni vozlišče sistem Hadoop namestitev

1) Namestitev JDK na Red Hat ali CentOS 5+ Sistem.

$ ./jdk-6u26-linux-x64-rpm.bin.sh

Java je nameščena in nastavljena JAVA_HOME / usr / java / default

2) Namestitev Apache Hadoop 0.20.204.

$ rpm-i Hadoop-0.20.204.0-1.i386.rpm

3) Namestitev Apache Hadoop konfiguracijo in začne Hadoop procesi.

$ /usr / sbin / Hadoop-setup-en-node.sh

Čarovnik vas bo vodil skozi seznam vprašanj za namestitev Hadoop. Hadoop je treba vožnjo po odgovoru 'Y' na vsa vprašanja.

Ustvari svoj uporabniški račun na HDFS zase.

$ /usr / sbin / Hadoop-create-user.sh-u $ USER

B) Multi-vozlišča Hadoop nastavitev

1) Namestite tako JDK in Hadoop 0.20.204.0 Narejeni na vseh vozliščih

2) Ustvari Hadoop konfiguracije na vseh vozliščih:

$ /usr / sbin / Hadoop-setup-conf.sh \
  --namenode-url=hdfs://${namenode}:9000/ \
  --jobtracker url = ${jobtracker}:9001 \
  --conf-dir = / etc / Hadoop \
  --HDF-dir = / var / lib / Hadoop / HDF \
  --namenode-dir=/var/lib/hadoop/hdfs/namenode \
  --mapred-dir = / var / lib / Hadoop / mapred \
  --datanode-dir = / var / lib / Hadoop / HDF / podatki \
  --log-dir = / var / log / Hadoop \
  --auto

Če ${namenode} in ${jobtracker} treba nadomestiti z imenom gostitelja namenode in jobtracker.

3) Format namenode in nastavitev privzeto postavitev HDFS.

$ /usr / sbin / Hadoop-setup-hdfs.sh

4) Začnite vseh podatkovnih vozlišč.

$ /etc / init.d / Hadoop-datanode začetek

5) Začnite vozlišče delovnih tracker.

$ /etc / init.d / Hadoop-jobtracker začetek

6) Začetek vozlišča Tracker opravil.

$ /etc / init.d / Hadoop-naloga tracker starter

7) Ustvari svoj uporabniški račun na HDFS zase.

$ /usr / sbin / Hadoop-create-user.sh-u $ USER

C) Nastavitev Okolje za Hadoop

$ vi ~ /. bash_profile

V INSERT poti nastavljen za JAVA_HOME

Izvoz JAVA_HOME

Shranite datoteko s klikom esc:wq

Zagon. Bash_profile

$ Vir ~ /. bash_profile

Nastavite JAVA_HOME poti v okolje datoteke Hadoop

$ /etc / Hadoop / Hadoop-env.sh

D) Konfiguracija za Hadoop

Uporabite naslednji:

conf / core-site.xml:

<Konfiguracija>
<nepremičnine>
<Ime>fs.default.name</Ime>
<vrednost>hdfs://localhost:9000</vrednost>
</nepremičnine>
</Konfiguracija>

conf / hdfs-site.xml:

<Konfiguracija>
<nepremičnine>
<Ime>dfs.replication</Ime>
<vrednost>1</vrednost>
</nepremičnine>
</Konfiguracija>

conf / mapred-site.xml:

<Konfiguracija>
<nepremičnine>
<Ime>mapred.job.tracker</Ime>
<vrednost>localhost:9001</vrednost>
</nepremičnine>
</Konfiguracija>

To) Hadoop ukazi

$ Hadoop
$ Hadoop namenode formata (Oblikujte namenode, Če zaprosi za
answer pritisnite 'Y')
$ Hadoop NameNode (Začnite namenode)
$ je bil / -ime začetni dfs.sh (našli datoteko v imenik)
$ cd usr / sbin (Pojdi na ustrezni imenik neposredno)
$ začetek dfs.sh
$ start-mapred.sh

$ Hadoop fs-ls / (Prikazuje mape korenin HDFS)
$ hadooop fs-dal input/file01 / input/file01 (Kopiranje lokalnega input/file01 do
HDFS root / input/file01)

Tagged on:
============================================= ============================================== Buy best TechAlpine Books on Amazon
============================================== ---------------------------------------------------------------- electrician ct chestnutelectric
error

Enjoy this blog? Please spread the word :)

Follow by Email
LinkedIn
LinkedIn
Share