有哪位朋友知道进行Hadoop数据分析之前怎么把 数据 预处理成特定格式吗?

0
已邀请:
2

牟瑞 - 大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我! 2015-09-22 回答

实际上这就是一个ETL的过程,最终拿到自己想要的数据格式。
处理数据不要局限于工具,开发语言,重点是数据本身。
工具类的你可以采用ETL工具,SSIS,kettle等
开发语言你可以开用Java,Python等
都是可以处理成特定的格式,然后倒入到hadoop的集群里面的
 
即使在hadoop的集群里面,也是可以采用hive,map/reduce,python,spark等来得到你想要的数据

要回复问题请先登录注册