请问用户画像分析,是离线数据Mapreduce,还是需要用到MLlib

0
已邀请:
0

regan - run! run! run! happy runner! 我是奔跑的小米~ 2017-03-17 回答

看你要做什么,如果只是刻画用户的画像,做一些简单的统计并不需要用到mllib,但让做离线大数据处理用mapreduce计算模型推荐首选spark做计算引擎,原因是速度比hadoop快。
如果要 涉及到对用户 行为的一些预测,对 用户关系网络 进行分析需要 用到图计算, 要根据用户的历史浏览数据,喜好,评论,做 聚类、推荐 当然是要 用到MLlib
 

要回复问题请先登录注册