单机 大数据平台搭建 2-- MapReduce和YARN

浏览: 1389

https://hadoop.apache.org/docs/stable/hadoop-yarn/hadoop-yarn-site/YARN.html  

YARN资源调度管理平台...对于那些上来就讲一堆理论的,理论+实践才是硬道理;想了解理论知识的可以去研究官方文档

6G}2MD24}X8LFLRD2J]C]GW.jpg

1. 配置YARN

安装指导 https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html

进入: /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop 按官网添加

19.png

●mapred-site.xml 

20.png

● yarn-site.xml

21.png

-- 启动/停止 ./stop-yarn.sh

22.png

查看:

23.png

2. 演示

演示“word count” 计算词频这个例子就像程序开发里的“hello world”;大家要时刻记得我们是分布式大数据平台上完成的word count。

24.png

HDFS上建文件夹,放文件,查看

25.png

HDFS上查看

26.png

官方提供的打包好的MapReduce 应用,打开源码可以发现这个应用的代码量大,复杂度高(MapReduce只提供了map和reduce两个组件),学习成本太高尤其是我们这些之前做数据开发,报表开发的。 而且因为是磁盘上计算,速度....这些隐患都讲在Spark上解决,后面再和大家分享

27.png


运行及查看结果:

#调用脚本 
hadoop jar /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar wordcount /input/wc/hello.txt /out/wc/

运行时在yarn可以看到有job在执行

28.png


29.png

上面的脚本引用了“hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar”是一个打包好的MapReduce应用,源码在

https://hadoop.apache.org/docs/stable/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduceTutorial.html#Example:_WordCount_v1.0

可以看到还是比较繁琐。

 至此hadoop的核心三大件: HDFS, MapReduce和YARN就都已经安装验证完成; 




推荐 0
本文由 攻城的狮子 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册