כיצד להגדיר Hadoop על צומת צומת ורבה אחד?

נתאר התקנת Hadoop בצומת אחת וצומת רבה. The Hadoop environment setup and configuration will be described in details. ראשית, עליך להוריד את התוכנה הבאה (סל"ד).

  • Java JDK RPM
  • Apache Hadoop 0.20.204.0 סל 'ד

A) אחת צומת מערכת Hadoop התקנה

1) התקנת JDK על רד האט או CentOS 5+ מערכת.

$ ./JDK-6u26-linux-x64-rpm.bin.sh

Java מותקן ומוגדר JAVA_HOME ל/ usr / Java / ברירת מחדל

2) התקנת Apache Hadoop 0.20.204.

$ rpm-i Hadoop-0.20.204.0-1.i386.rpm

3) התקנת Apache Hadoop תהליכי ההתחלה Hadoop ותצורה.

$ /usr / sbin /-יחיד node.sh Hadoop התקנה

אשף ההתקנה ינחה אותך ברשימה של שאלות להתקנת Hadoop. Hadoop צריך לרוץ אחרי שענה "Y" לכל השאלות.

יצירת חשבון משתמש בHDFS בעצמך.

$ /usr / sbin / Hadoop-create-user.sh u-USER $

B) Multi-צומת התקנת Hadoop

1) גם להתקין JDK וHadoop 0.20.204.0 RPMs על כל צומת

2) צור תצורת Hadoop על כל צומת:

$ /usr / sbin / Hadoop-התקנה-conf.sh \
  --namenode-url = hdfs://${namenode}:9000/ \
  --url = jobtracker ${jobtracker}:9001 \
  --conf-dir = / etc / Hadoop \
  --hdfs-dir = / var / lib / Hadoop / hdfs \
  --namenode-dir = / var / lib / Hadoop / hdfs / namenode \
  --mapred-dir = / var / lib / Hadoop / mapred \
  --datanode-dir = / var / lib / Hadoop / hdfs / נתונים \
  --יומן dir = / var / log / Hadoop \
  --אוטו

איפה ${namenode} ו - ${jobtracker} צריך להיות מוחלף עם מארח של namenode וjobtracker.

3) פורמט ברירת מחדל של ההתקנה וnamenode HDFS פריסה.

$ /usr / sbin / Hadoop-התקנה-hdfs.sh

4) התחל כל צומת הנתונים.

$ /תחילת etc / init.d / Hadoop-datanode

5) התחל צומת גשש עבודה.

$ /תחילת etc / init.d / Hadoop-jobtracker

6) התחל צומת גשש משימה.

$ /etc / init.d / Hadoop-משימת גשש המתנע

7) יצירת חשבון משתמש בHDFS בעצמך.

$ /usr / sbin / Hadoop-create-user.sh u-USER $

ג) סביבת התקנה לHadoop

$ vi ~ /. bash_profile

בדרך לסט במצב INSERT JAVA_HOME

היצוא JAVA_HOME

שמור את הקובץ על ידי לחיצה esc:wq

הפעלה. Bash_profile

$ מקור ~ /. bash_profile

הגדרת נתיב JAVA_HOME בקובץ סביבת Hadoop

$ /וכו / Hadoop / Hadoop-env.sh

D) תצורה עבור Hadoop

השתמש הבא:

conf / הליבה site.xml:

<תצורה>
<רכוש>
<שם>fs.default.name</שם>
<ערך>HDFS://localhost:9000</ערך>
</רכוש>
</תצורה>

conf / HDFS-site.xml:

<תצורה>
<רכוש>
<שם>dfs.replication</שם>
<ערך>1</ערך>
</רכוש>
</תצורה>

conf / mapred-site.xml:

<תצורה>
<רכוש>
<שם>mapred.job.tracker</שם>
<ערך>localhost:9001</ערך>
</רכוש>
</תצורה>

זה) פקודות Hadoop

$ Hadoop
$ Hadoop namenode בפורמט (עצב namenode, אם תבקש
תענה קש 'Y')
$ Hadoop namenode (התחל namenode)
$ למצוא / -שם סטארט dfs.sh (למצוא את הקובץ בספרייה)
$ usr cd / sbin (עבור לספרייה מתאימה באופן ישיר)
$ תתחיל-dfs.sh
$ סטארט mapred.sh

$ Hadoop FS-ls / (מציג את תיקיית שורש HDFS)
$ hadooop FS-לשים input/file01 / input/file01 (העתק input/file01 המקומי
HDFS שורש / input/file01)

Tagged on:
============================================= ============================================== Buy best TechAlpine Books on Amazon
============================================== ---------------------------------------------------------------- electrician ct chestnutelectric
error

Enjoy this blog? Please spread the word :)

Follow by Email
LinkedIn
LinkedIn
Share