最近有需求,需要使用python在Spark平台上重新实现mllib包中的协同过滤推荐算法,不知道有没有大神做过这方面的研究?直接阅读scala源码然后照着搬,还是有其他什么好的路径?

0
已邀请:
0

MarsJ - 大数据玩家~DS 2016-10-08 回答

Spark有对应支持的Python版本,不过貌似PySpark的环境也是个坑,可以踩坑然后分享经验。
MLlib中的协同过滤的链接:https://spark.apache.org/docs/latest/ml-collaborative-filtering.html
建议你把示例切换到Python,然后先把这部分代码Run起来,再改成适合你们的参数。。。先到到这种应用层面吧。
 

要回复问题请先登录注册