数据挖掘系列篇(17):新浪微博的排序推荐算法

浏览: 2681

————————————————收费转载————————————————

#作者:面包君

#专栏:数据分析侠http://zhuanlan.zhihu.com/dataman

因为目前主攻要解决内容排序的问题,所以对FB、微博等等的内容排序机制都比较关心,像FB的内容是比较少的,数据挖掘系列篇(16):Facebook内容排序算法研究有介绍道一些,感兴趣的可以多找找FB的算法朋友多聊聊这块的东西。

数据挖掘系列篇(16):Facebook内容排序算法研究这里主要是分享了下内容排序的背景和一些简单的维度,而在国内的微博其实内容上也差别不是太大,而有些思想上还是可以参考下,仅供参考。

官方的微博介绍是:智能排序是根据用户的关注、标签和微博内容等相关信息,帮助用户梳理微博内容,对同类微博进行合并、对可能感兴趣的微博内容进行优先展示的排序的功能。通过智能排序,能够帮你第一时间找到感兴趣的微博、合并微博中的重复信息、掌握朋友们共同关心的事情。



至于效果怎么样,我是没怎么发觉好的,可能也是因为本身微博的活跃度不够到底的,没几个是自己真实的好友。为什么微信朋友圈还不赶紧上朋友圈的内容排序!!@微信

————————————————收费转载————————————————

微博背景:共同话题!弱关系!媒体属性!

所以这个属性导致和数据挖掘系列篇(16):Facebook内容排序算法研究 Facebook的性质还不太一样,也导致在内容推荐上会有一些差别,当然微博在用户推荐、内容推荐上都做了一些思考,关于几点觉得还是不错的(虽然没觉得效果怎么样,关键产品不行)。

在用户推荐上:

1.具体衡量哪个指标:效果衡量指标是连接产品定位和算法优化方向的桥梁,而这也是产品设计中不断思考和摸索的方向。初始时我们直观地认为,如果用户喜欢推荐结果就会产生较高的点击率,从而将CTR作为衡量指标,但随后这个思路就被否定。用户推荐的初衷是关系达成而不是即时愉悦用户,于是衡量指标被调整为RPM(Relation per Thousand Impression,即千次曝光的用户关系达成量)。在一段时间后我们开始反思一个问题:用户关系达成的意义是什么,用户关系量是否是越多越好呢?答案显然是否定的,受限于精力,推荐必须帮助用户梳理关系网络结构,让用户可以简单地构建高价值的用户关系,从而让用户可以更好地消费内容以及更容易地进行社交互动,因此衡量指标衍生为关系达成后的互动率和用户行为量。我的理解应该是用户互动社交的关系链变长了,比如我在微博上30天内只是和3个人有过评论、转发、私信、点赞等动作,通过推荐之后在微博上30天内达到10人。

2.产品设计上,推荐是用户预期之外的非自然流量,应该顺应用户的行为,以自然流畅的方式展现给用户。因此,推荐必须从最有效的主动场景入手,比如微博找人页用户带有明显关注新用户的意图,而这里展示用户推荐正好满足需求;而Feed流的浏览目的是内容消费,推荐新用户会打断内容消费的流畅性,效果很差。所以大家也不难看到在微博找人上能看到你关注的人,相关性之类的排序。我倒是觉得像在用户推荐、你可能认识的人上也可以尝试看看推荐怎么样。毕竟这个很多人开了微博我也不知道。当然不要把人家的小三推荐给老婆这样的悲剧故事。

————————————————收费转载————————————————

内容排序:

而重点就是内容排序上了,看了下大部分也是借鉴的FB的算法思路,而用的算法也是传统的LR来学习的。主要场景是“错过的微博、赞过的微博、正文页相关推荐、热点话题”等具有代表性的内容推荐产品。

有个结论可以供参考下:用户错过的90+%信息中,只有部分内容是对用户具有极高价值且不容错过的,所以这里无需对未读Feed全排序,只需要将最高价值的信息找出来并推荐给用户,其它的Feed仍按正常时间序排列。这样做一方面可以让Feed流整体上符合Timeline的排序,用户感觉自然流畅;另一方面,与用户对最高价值的信息认知上比较接近,算法效果比较理想。产品推出后,用户认可度很高,互动率远远高于普通Feed。

应该来说我们如果在做内容排序上,对于用户的未读feed也会有相应的降权,借鉴FB的思想把亲密度这东西考虑的比较重要,时间和相应的一些简单活跃权重可以放低。

Clipboard Image.png

感觉微博上的数据特征还是比较少,能挖掘的东西应该也不是特别多。所以这个推荐的效果就不清楚是什么样了。看了下广告推荐的说是RPM那个关系达成是有30%(蓝、橙V)。

————————————————收费转载————————————————

系统框架上就不过多的BB了,离线和实时的推荐平台的那套东西。

如果觉得有价值,请大家支持!打赏点赞(据说可以加芝麻分哟:D)!另外数据分析联盟微信群也发展的很快,下面建个5群。

Clipboard Image.png

Clipboard Image.png

推荐 2
本文由 面包君 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册