在spark或者hadoop平台如何解析tar.gz包的问题?
0
有一个tar.gz包,里面是多个zip包,zip里面是多个txt文件。现在需要将txt文件解析出来,插入Hbase。在网上看到hadoop只支持四中压缩格式lzo,gzip,snappy,bzip2。那zip包是不是就没有办法解析了?应该采用hadoop还是spark平台来解决这个问题更合适?
没有找到相关结果
重要提示:提问者不能发表回复,可以通过评论与回答者沟通,沟通后可以通过编辑功能完善问题描述,以便后续其他人能够更容易理解问题.
1 个回复
牟瑞 - 大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我! 2015-11-06 回答
赞同来自: