在spark或者hadoop平台如何解析tar.gz包的问题?

0
有一个tar.gz包,里面是多个zip包,zip里面是多个txt文件。现在需要将txt文件解析出来,插入Hbase。在网上看到hadoop只支持四中压缩格式lzo,gzip,snappy,bzip2。那zip包是不是就没有办法解析了?应该采用hadoop还是spark平台来解决这个问题更合适?
已邀请:
0

牟瑞 - 大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我! 2015-11-06 回答

多大的tar.gz包啊?用python写个shell,解压出txt放入到hbase里面不可以么?不一定是hadoop或者spark吧?

要回复问题请先登录注册