Hadoop εγκατάστασης στο ενιαίο κόμβο και πολυ κόμβο

Θα περιγράψουμε Hadoop ρύθμιση για ενιαίο κόμβο και κόμβο πολλαπλών. The Hadoop environment setup and configuration will be described in details. Πρώτα θα πρέπει να κατεβάσετε το παρακάτω λογισμικό (rpm).

Java JDK RPM
Apache Hadoop 0.20.204.0 RPM

Ένα) Ενιαία κόμβο σύστημα Hadoop εγκατάστασης

1) Εγκατάσταση JDK σε Red Hat ή CentOS 5+ σύστημα.

$ ./jdk-6u26-linux-x64-rpm.bin.sh

Java είναι εγκατεστημένη και να JAVA_HOME στο / usr / java / default

2) Εγκατάσταση Apache Hadoop 0.20.204.

$ rpm-i Hadoop-0.20.204.0-1.i386.rpm

3) Ρύθμιση Apache Hadoop διαμόρφωση και την έναρξη των διαδικασιών Hadoop.

$ /usr / sbin / Hadoop-setup-single-node.sh

Ο οδηγός εγκατάστασης θα σας καθοδηγήσει μέσα από μια λίστα ερωτήσεων για εγκατάσταση Hadoop. Hadoop θα πρέπει να λειτουργεί μετά την απάντηση «Y» σε όλες τις ερωτήσεις.

Δημιουργήστε ένα λογαριασμό χρήστη για ΚΑΕ για τον εαυτό σας.

$ /usr / sbin / Hadoop-create-user.sh-u $ USER

Β) Multi-κόμβους ρύθμισης Hadoop

1) Εγκαταστήστε τόσο το JDK και Hadoop 0.20.204.0 RPMs σε όλους τους κόμβους

2) Δημιουργία διαμόρφωση Hadoop σε όλους τους κόμβους:

$ /usr / sbin / Hadoop-setup-conf.sh \

  --namenode-url=hdfs://${namenode}:9000/ \

  --jobtracker-url=${jobtracker}:9001 \

  --conf-dir=/etc/hadoop \

  --hdfs-dir=/var/lib/hadoop/hdfs \

  --namenode-dir=/var/lib/hadoop/hdfs/namenode \

  --mapred-dir=/var/lib/hadoop/mapred \

  --datanode-dir=/var/lib/hadoop/hdfs/data \

  --log-dir=/var/log/hadoop \

  --auto

Όπου ${namenode} και ${jobtracker} θα πρέπει να αντικατασταθεί με το hostname του namenode και jobtracker.

3) Μορφή namenode και προεπιλεγμένες ρυθμίσεις ΚΑΕ διάταξη.

$ /usr / sbin / Hadoop-setup-hdfs.sh

4) Ξεκινήστε όλους τους κόμβους δεδομένων.

$ /etc / init.d / Hadoop-datanode έναρξη

5) Ξεκινήστε τη δουλειά tracker κόμβο.

$ /etc / init.d / Hadoop-jobtracker έναρξη

6) Ξεκινήστε κόμβους έργο tracker.

$ /etc / init.d / Hadoop-έργο tracker μίζα

7) Δημιουργήστε ένα λογαριασμό χρήστη για ΚΑΕ για τον εαυτό σας.

$ /usr / sbin / Hadoop-create-user.sh-u $ USER

C) Περιβάλλον Ρύθμιση για Hadoop

$ vi ~ /. bash_profile

Στην πορεία που INSERT τρόπος για JAVA_HOME

Εξαγωγή JAVA_HOME

Αποθηκεύστε το αρχείο κάνοντας κλικ esc:wq

Εκτελέστε το. Bash_profile

$ πηγή ~ /. bash_profile

Ορισμός JAVA_HOME διαδρομή στο αρχείο Περιβάλλον Hadoop

$ /etc / Hadoop / Hadoop-env.sh

D) Ρύθμιση για Hadoop

Χρησιμοποιήστε την ακόλουθη:

conf / πυρήνα site.xml:

<διαμόρφωση>

<περιουσία>

<όνομα>fs.default.name</όνομα>

<αξία>ΚΑΕ://localhost:9000</αξία>

</περιουσία>

</διαμόρφωση>

conf / ΚΑΕ-site.xml:

<διαμόρφωση>

<περιουσία>

<όνομα>dfs.replication</όνομα>

<αξία>1</αξία>

</περιουσία>

</διαμόρφωση>

conf / mapred-site.xml:

<διαμόρφωση>

<περιουσία>

<όνομα>mapred.job.tracker</όνομα>

<αξία>localhost:9001</αξία>

</περιουσία>

</διαμόρφωση>

Το) Εντολές Hadoop

$ Hadoop
$ Hadoop namenode-format (Διαμορφώστε την namenode, Αν ζητήσει να
απαντήσει τύπου «Υ»)
$ Hadoop NameNode (Ξεκινήστε την namenode)
$ βρίσκω / -αναφέρουμε έναρξη dfs.sh (βρείτε το αρχείο στον κατάλογο)
$ cd usr / sbin (Πηγαίνετε στο αντίστοιχο κατάλογο άμεσα)
$ έναρξη dfs.sh
$ έναρξη mapred.sh

$ Hadoop fs-ls / (Εμφανίζει το φάκελο ΚΑΕ)
$ hadooop fs-βάλει input/file01 / input/file01 (Αντιγράψτε τοπική input/file01 να
ΚΑΕ root / input/file01)

Share on Facebook

Save

Tagged on: Big Data

TechAlpine – All About Technology

www.techalpine.com

Πως να ρυθμίσετε το Hadoop σε ενιαίο κόμβο και κόμβο πολλαπλών?

Enjoy this blog? Please spread the word :)