请教一个问题hive里怎样改写select count(distinct **),避免出现distinct!!!! 考虑过采用 ROW_NUMBER() OVER(PARTITION BY ** ORDER BY * DESC) RN 和group by 都不能很好解决
0
没有找到相关结果
重要提示:提问者不能发表回复,可以通过评论与回答者沟通,沟通后可以通过编辑功能完善问题描述,以便后续其他人能够更容易理解问题.
1 个回复
MarsJ - 大数据玩家~DS 2016-08-15 回答
赞同来自:
如果是要求速度更快一些,建议从Hive切换出去,用Spark SQL或其他的组件做