0
推荐
2563
阅读

数据开发系列篇(3):spark实战高手之路(一):如何搭建spark集群 面包君

从零起步,构建Spark集群经典四部曲:第一步:搭建Hadoop单机和伪分布式环境;第二步:构造分布式Hadoop集群;第三步:构造分布式的Spark集群;第四步:测试Spark集群;本文内容为构建Spark集群经典四部曲,从零起步构建Hadoop单机版本和伪分布式的开发环境,涉及:开发Hadoop需要的基本软件;安装每个软件;配置Hadoop...

发表了文章 • 2017-05-19 09:36 • 0 条评论

0
推荐
2401
阅读

数据开发系列篇(2):大数据处理和编程实践Hadoop(二)

下面是岑文初师兄总结的Hadoop入门的实践放翁(文初)的一亩三分地,基本上可以作为入门了解去看下,太细节的可以自己去找本书看看。其实参看Hadoop官方文档已经能够很容易配置分布式框架运行环境了,不过这里既然写了就再多写一点,同时有一些细节需要注意的也说明一下,其实也就是这些细节会让人摸索半天。Hadoop可以...

发表了文章 • 2017-05-19 09:07 • 0 条评论

9
推荐
3903
阅读

数据开发系列篇(1):大数据处理和编程实践Hadoop(一)

—————————————————禁止转载———————————————————————————#作者:面包君#时间:2016-4-7#知乎专栏:数据分析侠http://zhuanlan.zhihu.com/dataman首先也是非常支持天善搞的读书分享这种活动,对于知识的沉淀和分享都非常有益处,数据分析和数据挖掘都吐的比较多,而刚入门时一手操刀的数据仓库和数据处理在11年的时候是写...

发表了文章 • 2016-04-07 11:20 • 8 条评论