如何实现hive分组抽样返回数据?

0
如何实现hive分组, 抽样隔条返回数据:
group score
A 1 
A 2
A 3
A 4
A 5
A 6
B 10
B 11
B 12
B 13
B 14
B 15

要求按照group分组后,每组隔条返回记录:
group score
A 1 
A 3
A 5
B 10
B 12
B 14

hive能直接实现吗? 如果不行udaf应该如何写?
已邀请:
0

Bob - 同程旅游大数据+BI 架构师 2016-06-12 回答

在hive中有row_number()函数,例如 row_number( order by uuid() )
uuid函数:select reflect(“java.util.UUID”, “randomUUID”) from table
其他的抽样也可以用TABLESAMPLE函数

要回复问题请先登录注册