0
推荐
3682
阅读

【NLP干货】深度学习在美团点评推荐业务中实践

数据分析联盟 今天  点击上方“数据分析联盟”,“星标或置顶公众号”关键时刻,第一时间送达前言近年来,深度学习在语音识别、计算机视觉及自然语言处理等领域都取得了很大的突破,成为学术界和工业界关注的热点。与传统机器学习方法相比,深度学习在特征抽取及特征组合方面具有明显的优势,可以学习到多层次的抽...

发表了文章 • 2019-01-16 18:39 • 0 条评论

0
推荐
1790
阅读

<<战狼Ⅱ>>豆瓣十二万影评浅析

【温馨提示:如果想要本文爬取的豆瓣评论的数据请在评论区留下邮箱或联系文末作者!】最近异常火爆。《战狼Ⅱ》是吴京执导的动作军事电影,由吴京、弗兰克·格里罗、吴刚、张翰、卢靖姗、丁海峰等主演。该片于2017年7月27日在中国内地上映。2017年8月11日凌晨,《战狼2》票房(含服务费)突破40亿元,打破《美人鱼》此前创...

发表了文章 • 2017-08-24 15:25 • 0 条评论

0
推荐
2392
阅读

数据挖掘系列篇(26):无线搜索广告中的CTR预测

CTR预估(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。本次总结主要从CTR的模型训练流程、CTR融合模型和效果等角度,重点把之前做的留个笔记。1.CTR流程训练流程主要包括:原始数据→特征工程→模型训练→线上排序Data是原始数据,包括点击及查询日志,从这些原始数据...

发表了文章 • 2017-05-19 14:44 • 0 条评论

0
推荐
2727
阅读

数据挖掘系列篇(25):基于地理位置的数据挖掘

一般我们在做数据挖掘过程中地理位置算是一个特别重要的特征,广泛应用于O2O的很多场景。但做的事情都相对来说比较简单,LBS的网格位置推相应的内容。原来我们基于地理位置拿了不少数据,也做了一些模型,主要是一些医院位置、商场位置、公交地铁位置等来给附近的人推服务。不同定位比较:在当前众多的无线定位技术中,G...

发表了文章 • 2017-05-19 13:54 • 0 条评论

0
推荐
1795
阅读

数据挖掘系列篇(24):BTS分享

有段时间不来了,最近忙了不少事情,投了几家实体火锅店铺,感慨现在杭州的房价真的比股票、黄金还快,动不动都是遍地3W一平的,实在无心写coding了。BTS(bucket test system)分桶测试在我们日常的搜索优化上应用的比较多,所以就花点时间来整理下吧,希望对一些人能有用。像我们在做算法上线过程中,哪些策略好,哪些...

发表了文章 • 2017-05-19 12:45 • 0 条评论

0
推荐
1951
阅读

数据挖掘系列篇(22):一淘的个性化搜索技术

最近一姐们说拿到了offer,听到这消息还是比较开心。最近一年hc都很有限,能进都属不易。不管是什么“月饼门”事件,还是百度内部“反腐”,干技术的自己无愧于心就行了。现在在折腾搜索这块的个性化,query改写、分词处理、suggest、doc排序、上下文、相似度、同类人群等等还在学习。这块一淘在做淘宝的商品搜索还是有不少...

发表了文章 • 2017-05-19 12:41 • 0 条评论

0
推荐
1859
阅读

数据挖掘系列篇(21):1号店的个性化推荐平台

https://yunpan.cn/c6s7mVVtsWwtT (提取码:e52f)

发表了文章 • 2017-05-19 10:45 • 0 条评论

0
推荐
1800
阅读

数据挖掘系列篇(20):社交网络SNS的好友推荐算法

花了几天看了些做社交的好友推荐,现在很多App都有社交场景,本身就是做用户的场景,所以以后肯定要在这块有一些应用。像早期的论坛类的更偏重资讯类的信息,后来像优酷土豆这又是做视频类,网易云音乐做音乐类。豆瓣相对来说还比较全一些,有包含资讯、音乐电台等这些。也用了一些其他做社交场景的App,包括像脉脉、钉...

发表了文章 • 2017-05-19 10:26 • 0 条评论

0
推荐
1518
阅读

数据挖掘系列篇(19):视频网站个性化推荐Hulu&土豆

最近事情实在是比较多,要给几家公司做一下数据化运营的培训,另外还有不少金融投资领域的研究报告要交。有合作的需求可以发邮件到784414374@qq.com邮箱。和BOSS直聘的总监聊了下,了解到现在的BOSS很多对数据部门或者数据岗位的定位都不太清楚,准备策划一期围绕数据化运营的线下活动。现在有家创业公司想做类似视频头...

发表了文章 • 2017-05-19 09:47 • 0 条评论

0
推荐
2014
阅读

数据挖掘系列篇(18):走进Facebook公司内部,动态消息算法揭秘

前段时间已经聊到Facebook的edgerank算法和timeline。数据分析侠:Facebook的内容排序算法推荐,还希望大家能够多关注知乎专栏数据分析侠,点赞支持!借此机会能够把Facebook的动态内容算法再补充补充,有些故事还是有趣值得玩味,还有关于介绍到的Facebook的灰度测试,做数据的奴隶。还有些比较有趣的文章都可以看下:...

发表了文章 • 2017-05-18 16:51 • 0 条评论

2
推荐
2648
阅读

数据挖掘系列篇(17):新浪微博的排序推荐算法

————————————————收费转载————————————————#作者:面包君#专栏:数据分析侠http://zhuanlan.zhihu.com/dataman因为目前主攻要解决内容排序的问题,所以对FB、微博等等的内容排序机制都比较关心,像FB的内容是比较少的,数据挖掘系列篇(16):Facebook内容排序算法研究有介绍道一些,感兴趣的可以多找找FB的算法朋友多聊聊...

发表了文章 • 2016-04-14 10:21 • 0 条评论

5
推荐
5548
阅读

数据挖掘系列篇(17):推荐系统的常用算法对比

————————————————————禁止转载—————————————————————#作者:面包君#时间:2016-4-6#知乎专栏:http://zhuanlan.zhihu.com/dataman我们在应用到的机器学习中,推荐系统应该是应用到的最为广场的场景了。而在推荐环节算法也是最核心的部分,常用的算法也是无外乎几种,当然如果有好的算法也可以推荐下。之前在推荐系统简介...

发表了文章 • 2016-04-06 14:58 • 1 条评论

3
推荐
2215
阅读

数据挖掘系列篇(16):Facebook内容排序算法研究

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:面包君链接:http://zhuanlan.zhihu.com/p/20713521来源:知乎最近研究了下Facebook内容排序问题,这个在新浪微博、知乎内容排序这些场景下都应用到。主要是关于edgerank的算法讨论以及Facebook的AB test机制。EdgeRank 是Facebook 在 F8 开...

发表了文章 • 2016-04-06 12:07 • 3 条评论

0
推荐
4571
阅读

数据挖掘系列篇(15):R语言VS主成分分析的案例

      R语言也介绍到案例篇了,也有不少同学反馈说还是不是特别明白一些基础的东西,希望能够有一些比较浅显的可以操作的入门。其实这些之前在SAS实战案例都写过不少,老实说一旦用上了开源工具就好像上瘾了,对于以前的SAS、clementine之类的可视化工具没有一点感觉了。本质上还是觉得要装这个、装那个...

发表了文章 • 2016-03-11 19:43 • 0 条评论

6
推荐
2841
阅读

数据挖掘系列篇(12):贝贝网的机器学习实现

这次主要是杭州的几个公司一起交流,分享了各自的机器学习和数据分析的实现。后面还会继续组织杭州地区的活动分享,贝贝网周总主要介绍了贝贝网的数据平台实现和一些推荐功能的部署与效果,还是有不少干货的。还有其他几个公司的,后面陆续都分享上来,这里先分享和机器学习相关的。贝贝网的主要产品是垂直的母婴类,有...

发表了文章 • 2016-01-26 20:35 • 6 条评论