配置过程
hadoop-env.sh
1
2export JAVA_HOME=/opt/java/jdk1.7.0_80
export HADOOP_PREFIX=/opt/hadoop-2.6.4core-site.xml
1
2
3
4
5
6
7
8
9
10<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop-2.6.4/tmp</value>
</property>
</configuration>注意:tmp目录需提前创建
hdfs-site.xml
1
2
3
4
5
6<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
</configuration>数据有三个副本
mapred-site.xml
1
2
3
4
5
6<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>yarn-env.sh
增加 JAVA_HOME 配置
1
export JAVA_HOME=/opt/java/jdk1.7.0_80
yarn-site.xml
1
2
3
4
5
6
7
8
9
10
11
12<configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>nodeh1</value>
</property>
</configuration>slaves
1
2
3master
slave01
slave02master 即作为 NameNode 也作为 DataNode。
启动过程
格式化文件系统,在 master 上执行以下命令:
1
hdfs namenode -format
启动 NameNode 和 DateNode,执行
start-dfs.sh
,使用 jps 命令查看进程。输入地址:http://master:50070/ 可以查看 NameNode 信息。
启动 ResourceManager 和 NodeManager,运行
start-yarn.sh
, 使用 jps 查看 进程
测试
1 | hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /data/input /data/output/result |