Hadoop、spark分析excel文件有什么建议经验分享?

0
已邀请:
0

Bob - 同程旅游大数据+BI 架构师 2016-06-12 回答

建议数据先在hadoop进行预处理,生成文本内容后再使用spark或hive进行后续的处理
 
在使用hadoop进行excel操作时,可能需要自定义inputformat

要回复问题请先登录注册