1
推荐
1645
阅读

Mahout学习路线图

前言Mahout是Hadoop家族中与众不同的一个成员,是基于一个Hadoop的机器学习和数据挖掘的分布式计算框架。Mahout是一个跨学科产品,同时也是我认为Hadoop家族中,最有竞争力,最难掌握,最值得学习的一个项目之一。Mahout为数据分析人员,解决了大数据的门槛;为算法工程师,提供基础的算法库;为Hadoop开发人员,提供了...

发表了文章 • 2017-04-06 09:03 • 0 条评论

1
推荐
1797
阅读

Hive学习路线图

前言Hive是Hadoop家族中一款数据仓库产品,Hive最大的特点就是提供了类SQL的语法,封装了底层的MapReduce过程,让有SQL基础的业务人员,也可以直接利用Hadoop进行大数据的操作。就是这一个点,解决了原数据分析人员对于大数据分析的瓶颈。让我们把Hive的环境构建起来,帮助非开发人员也能更好地了解大数据。目录Hive介绍...

发表了文章 • 2017-04-05 09:20 • 0 条评论

2
推荐
2029
阅读

Hadoop家族学习路线图 开篇必读

前言使用Hadoop已经有一段时间了,从开始的迷茫,到各种的尝试,到现在组合应用….慢慢地涉及到数据处理的事情,已经离不开hadoop了。Hadoop在大数据领域的成功,更引发了它本身的加速发展。现在Hadoop家族产品,已经达到20个了之多。有必要对自己的知识做一个整理了,把产品和技术都串起来。不仅能加深印象,更可以对以...

发表了文章 • 2017-04-05 09:16 • 0 条评论