你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
没有找到相关结果
为了明天time - hadoop hive 大数据 java python 2015-10-23 回答
赞同来自:
Bob - 同程旅游大数据+BI 架构师 2015-10-23 回答
要回复问题请先登录或注册
李慕白
推荐一份编程学习资源,包含了各类编程语言学习进阶路线图、视频教程、配套书籍文档、数百份面经,各大厂面试真题。编程语言包括:Java、前端、PHP、Python、Linux运维、软件测试、数据解构与算法、C语言、go语言等
微信扫码关注公众号,发送 "编程"获取资源
2 个回复
为了明天time - hadoop hive 大数据 java python 2015-10-23 回答
赞同来自:
Bob - 同程旅游大数据+BI 架构师 2015-10-23 回答
赞同来自:
如果需要进行海量数据的清洗和存储,可以考虑用Hadoop集群。
Hadoop生态中有很多的组件来应用到不同的场景:
1.如果你想支撑高并发的查询,则可存储到hbase集群
2.如果是想做数据的计算、清洗,则可以用hive、pig 或者是 spark
3.如果想根据历史数据做算法分析和预测,则可以编写MR程序或SPARK
以上的都是需要投入人才、资源等。
传统数据库则可充分发挥即席查询、事物管理,能更好的兼容现有的系统。
如果数据体量特大,则应该以Hadoop集群为主
在真实场景中,要充分发挥各自的优势,结合起来使用.