关于Sqoop1.99.6的性能问题!

0
想问一下各位同学,用sqoop1.99.6,实现从 oracle导清单到hdfs, 40多万的数据表,输出60M左右的文件到hdfs,成功了。

但2千多万的清单,预计生成 超过1G的txt文件, 在sqoop日志里,总是提示“INFO  repository.JdbcRepositoryTransaction [org.apache.sqoop.repository.JdbcRepositoryTransaction.close(JdbcRepositoryTransaction.java:111)] Attempting transaction commit” 每5分钟一个,超过半个小时,无任何txt结果输出,这个有遇到过吗? 怎么处理
已邀请:
1

牟瑞 - 大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我! 2015-12-08 回答

不好意思。兄弟,你这个oracle是真没有遇到过。我个人的建议如下:
1.降低sqoop1.99.6版本到sqoop 1.99.3版本试一下。
2.运行sqoop的时候监控下系统的资源情况。
3.换一种思路或者方案,sqoop毕竟只是一个工具,不一定能解决所有的问题,看看能否通过导出的方式,先导出,然后再上传到HDFS上
 
以上,有问题欢迎随时沟通。
0

reeb2000 - china telecom 2015-12-08 回答

确实,降低一个版本1.99.5就OK了。真是奇怪。谢谢大师指点。
0

呆呆 2017-10-20 回答

刚开始接触,请问oracle导数据到hdfs。具体操作如何?

要回复问题请先登录注册