请教大家个问题,我这有个应用场景,做学生与就业信息的推荐,我的思路是如下描述

0
 请教大家个问题,我这有个应用场景,做学生与就业信息的推荐,我的思路是

1、从各大招聘网站上,爬取大量的招聘、实习信息;

2、将招聘实习信息进行聚类,比如利用k-means等算法;

3、每个类别提取关键字或者主题,为招聘文本打标签,比如利用LDA主题模型;

4、制作用户画像,每个用户打上一些标签,这个数据直接可以获取,比如学生所属城市、院系、专业,和用户自定义标签,比如会哪些技术或擅长哪些领域;

5、将3、4两种标签进行关联,做推荐。

大家觉得怎么样?

另外,有个至关重要的第5步,该如何做关联?利用什么算法和思路?请大家指点下,谢谢 
已邀请:
2

SmartMining - 数据挖掘、商业智能、大数据从业者:相关产品设计、项目管理、咨询、培训 2016-01-07 回答

您好!这个思路没有问题。也正如您所说的第五步至关重要。而第三步和第四步的核心就是对学生进行画像,建设学生完善的标签库。这个是推荐的基础和学生基本信息保证。在学生的标签完善后,就好办了,完全可以靠数据挖掘的技术来解决,也就是第五步。主要有两类算法可以实现,而且都要用,不是二选一。
第一类算法,分类预测算法。我们首先需要把工作岗位分类和分级,以工作的类别或级别为目标变量,用户的标签为影响因为,建立预测模型,也即推荐模型。
第二类算法,关联分析算法,也叫购物篮分析。我们可以把历史学员选择的工作类别或者学生标识作为一个购物篮,学生的标签作为商品,一个学生找到一个工作,就好比把把一个学生的标签作为了“商品”放在这个购物篮(学生身上)里卖给了这个工作,以此作为数据基础建立关联分析模型,这就转化为了类似电商商品推荐的思路。

要回复问题请先登录注册