哪位大神做过用Spark合并多个parquet文件,求个思路

0
已邀请:
2

Bob - 同程旅游大数据+BI 架构师 2015-10-26 回答

可以在save前调用coalesce(1)方法
val rows = parquetFile(...).coalesce(1) rows.saveAsParquetFile(...)

要回复问题请先登录注册