TechAlpine – All About Technology

www.techalpine.com

როგორ შეიქმნა Hadoop წლის მარტოხელა კვანძის და მრავალ კვანძში?

ჩვენ აღწერს Hadoop setup on single კვანძის და მრავალ კვანძში. The Hadoop environment setup and configuration will be described in details. პირველი თქვენ უნდა ჩამოტვირთოთ პროგრამული უზრუნველყოფის შემდეგ (rpm).

Java JDK RPM
Apache Hadoop 0.20.204.0 RPM

A) უცოლო კვანძის სისტემის Hadoop setup

1) დააინსტალირეთ JDK on Red Hat ან CentOS 5+ სისტემაში.

$ ./jdk-6u26-Linux-x64-rpm.bin.sh

Java არის დამონტაჟებული და მითითებული JAVA_HOME to / usr / java / default

2) დააინსტალირეთ Apache Hadoop 0.20.204.

$ rpm-i hadoop-0.20.204.0-1.i386.rpm

3) Setup Apache Hadoop კონფიგურაცია და დაწყება Hadoop პროცესები.

$ /usr / sbin / hadoop-setup-single-node.sh

ჩადგმის ოსტატი დაგეხმარებათ იმ კითხვების ნუსხას setup Hadoop. Hadoop უნდა გაშვებული პასუხის გაცემის შემდეგ "Y" ყველა კითხვას.

შექმნა მომხმარებლის ანგარიშზე HDFS თქვენთვის.

$ /usr / sbin / hadoop-Create-user.sh-U $ USER

B) Multi-კვანძების Hadoop setup

1) დააინსტალირეთ ორივე JDK და Hadoop 0.20.204.0 RPMs ყველა კვანძების

2) გენერაცია hadoop კონფიგურაციის ყველა კვანძების:

$ /usr / sbin / hadoop-setup-conf.sh \

  --namenode-url = HDFS://${namenode}:9000/ \

  --jobtracker url = ${jobtracker}:9001 \

  --conf-dir = / etc / Hadoop \

  --HDFS-dir = / var / lib / Hadoop / HDFS \

  --namenode-dir = / var / lib / Hadoop / HDFS / namenode \

  --mapred-dir = / var / lib / Hadoop / mapred \

  --datanode-dir = / var / lib / Hadoop / HDFS / მონაცემები \

  --შესვლა რეჟ = / var / log / Hadoop \

  --განცხადება

სად ${namenode} და ${jobtracker} უნდა შეიცვალოს hostname of namenode და jobtracker.

3) ფორმატი namenode და setup რა HDFS განლაგება.

$ /usr / sbin / hadoop-setup-hdfs.sh

4) დაწყება ყველა მონაცემი კვანძების.

$ /etc / init.d / hadoop-datanode დაწყება

5) დაწყება სამუშაოს tracker კვანძში.

$ /etc / init.d / hadoop-jobtracker დაწყება

6) დაწყება ამოცანა tracker კვანძების.

$ /etc / init.d / Hadoop-ამოცანა tracker შემქმნელის

7) შექმნა მომხმარებლის ანგარიშზე HDFS თქვენთვის.

$ /usr / sbin / hadoop-Create-user.sh-U $ USER

C) Setup გარემო Hadoop

$ VI ~ /. bash_profile

In INSERT რეჟიმში კომპლექტი გზა JAVA_HOME

ექსპორტი JAVA_HOME

ფაილის შენახვა დაწკაპვით ESC:wq

აწარმოებს. Bash_profile

$ წყარო ~ /. bash_profile

უცნობია JAVA_HOME ბილიკი Hadoop გარემოს ფაილი

$ /etc / Hadoop / Hadoop-env.sh

D) კონფიგურაცია Hadoop

გამოიყენოს შემდეგი:

conf / core-site.xml:

<კონფიგურაციის>

<ქონების>

<სახელი>fs.default.name</სახელი>

<ღირებულება>hdfs://Localhost:9000</ღირებულება>

</ქონების>

</კონფიგურაციის>

conf / hdfs-site.xml:

<კონფიგურაციის>

<ქონების>

<სახელი>dfs.replication</სახელი>

<ღირებულება>1</ღირებულება>

</ქონების>

</კონფიგურაციის>

conf / mapred-site.xml:

<კონფიგურაციის>

<ქონების>

<სახელი>mapred.job.tracker</სახელი>

<ღირებულება>Localhost:9001</ღირებულება>

</ქონების>

</კონფიგურაციის>

იგი) Hadoop ბრძანებები

$ hadoop
$ hadoop namenode-ფორმატში (ფორმატირება namenode, თუ დაელოდონ
უპასუხოს პრესის 'Y')
$ hadoop NameNode (დაწყება namenode)
$ იპოვოს / -ასახელებს დაწყება-dfs.sh (სასურველი ფაილი დირექტორიაში)
$ CD usr / sbin (გადავიდეთ შესაბამის დირექტორიაში პირდაპირ)
$ დამწყებ dfs.sh
$ დაწყება-mapred.sh

$ hadoop FS-ls / (გადაცემები HDFS root ფოლდერში)
$ hadooop FS-დააყენა input/file01 / input/file01 (დააკოპირეთ ადგილობრივი input/file01 to
HDFS root / input/file01)