人工智能爱好者社区

公众号:人工智能爱好者社区;专注人工智能、人脸识别、自然语言处理、图形识别等顶尖技术前沿科技成果研究、实战技巧。立即关注,掌握人工智能最新资讯与成果。

0
推荐
1198
阅读

如何理解马云演讲「十年后没有数据分析师的职业」

作者介绍李宁 :著《数据化运营:系统方法与实践案例》书籍,现于某知名外卖订餐平台担任数据专家,先后于艾瑞、携程从事数据相关工作。缘起结缘:我个人很喜欢研究马云的研究,一是认为他把事情做到了不可思议的高度,二是他很爱对未来思考而且愿意把成果分享。能够接触他的思想,是一件非常幸运的事情。我踏入数...

发表了文章 • 2018-10-23 16:48 • 0 条评论

2
推荐
1448
阅读

转行数据行业的普通大学生如何逆袭秋招!

12015年的冬天,我平生第一次来到了大上海。一到上海,我就被魔都的繁华吸引了。当我站在外滩时,我就在想我一定要留在上海。2016年3月,各大高校的考研录取分数线出来了,我离自己的第一志愿还差好多,那时,我颓废了,迷茫感席卷而来,每天早起晚睡,不是抽烟就是打游戏。家里看我研究生无望,就找关系让人给我介绍了...

发表了文章 • 2018-10-23 16:47 • 0 条评论

0
推荐
1327
阅读

【十大经典数据挖掘算法】CART

作者简介:Treant  人工智能爱好者社区专栏作者博客专栏:https://www.cnblogs.com/en-heng前言分类与回归树(Classification and Regression Trees, CART)是由四人帮Leo Breiman, Jerome Friedman, Richard Olshen与Charles Stone于1984年提出,既可用于分类也可用于回归。本文将主要介绍用于分类的CART。CART被...

发表了文章 • 2018-10-10 16:23 • 0 条评论

1
推荐
2290
阅读

一点做用户画像的人生经验:ID强打通

作者简介:Treant  人工智能爱好者社区专栏作者博客专栏:https://www.cnblogs.com/en-heng1.背景在构建精准用户画像时,面临着这样一个问题:日志采集不能成功地收集用户的所有ID,且每条业务线有各自定义的UID用来标识用户,从而造成了用户ID的零碎化。因此,为了做用户标签的整合,用户ID之间的强打通(亦称为ID...

发表了文章 • 2018-10-10 16:21 • 1 条评论

0
推荐
1411
阅读

【十大经典数据挖掘算法】Naïve Bayes

作者简介:Treant  人工智能爱好者社区专栏作者博客专栏:https://www.cnblogs.com/en-heng朴素贝叶斯(Naïve Bayes)属于监督学习的生成模型,实现简单,没有迭代,学习效率高,在大样本量下会有较好的表现。但因为假设太强——假设特征条件独立,在输入向量的特征条件有关联的场景下并不适用。1.朴素贝叶斯算法朴素...

发表了文章 • 2018-10-10 16:18 • 0 条评论

0
推荐
1595
阅读

【十大经典数据挖掘算法】kNN

作者简介:Treant  人工智能爱好者社区专栏作者博客专栏:https://www.cnblogs.com/en-heng1.引言顶级数据挖掘会议ICDM于2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naïve Bayes与 CART。 以前看过关于这些数据挖掘算法,但对背后数学原理未做过多...

发表了文章 • 2018-10-10 16:17 • 0 条评论

0
推荐
1474
阅读

【从传统方法到深度学习】情感分析

作者简介:Treant  人工智能爱好者社区专栏作者博客专栏:https://www.cnblogs.com/en-heng1.问题Kaggle竞赛Bag of Words Meets Bags of Popcorn是电影评论(review)的情感分析,可以视作为短文本的二分类问题(正向、负向)。标注数据集长这样:评价指标是AUC。因此,在测试数据集上应该给出概率而不是类别;即为...

发表了文章 • 2018-10-10 16:15 • 0 条评论

0
推荐
1472
阅读

【强推】18年八月互联网名企秋招面试题整理

作者:石晓文,中国人民大学信息学院在读研究生,个人公众号:小小挖掘机(ID:wAIsjwj)八月参加了一些提前批的面试,包括阿里、百度、头条、贝壳、一点资讯等。整理了一些面试题,分享给大家。一、机器学习基础题1、LSTM的公式2、RNN为什么出现梯度消失及BPTT的推导3、DQN的基本原理么4、GBDT和随机森林有什么区别5、GB...

发表了文章 • 2018-09-12 16:37 • 0 条评论

0
推荐
1069
阅读

【十大经典数据挖掘算法】AdaBoost

作者简介:Treant  人工智能爱好者社区专栏作者博客专栏:https://www.cnblogs.com/en-heng1.集成学习集成学习(ensemble learning)通过组合多个基分类器(base classifier)来完成学习任务,颇有点“三个臭皮匠顶个诸葛亮”的意味。基分类器一般采用的是弱可学习(weakly learnable)分类器,通过集成学习,组合成...

发表了文章 • 2018-09-10 14:23 • 0 条评论

0
推荐
1127
阅读

【十大经典数据挖掘算法】PageRank

作者简介:Treant  人工智能爱好者社区专栏作者博客专栏:https://www.cnblogs.com/en-heng引言PageRank是Sergey Brin与Larry Page于1998年在WWW7会议上提出来的,用来解决链接分析中网页排名的问题。在衡量一个网页的排名,直觉告诉我们:当一个网页被更多网页所链接时,其排名会越靠前;排名高的网页应具有更大的...

发表了文章 • 2018-09-10 14:20 • 0 条评论

0
推荐
1209
阅读

【十大经典数据挖掘算法】EM

作者简介:Treant  人工智能爱好者社区专栏作者博客专栏:https://www.cnblogs.com/en-heng1.极大似然极大似然(Maximum Likelihood)估计为用于已知模型的参数估计的统计学方法。比如,我们想了解抛硬币是正面(head)的概率分布;那么可以通过最大似然估计方法求得。假如我们抛硬币1010次,其中88次正面、22次反...

发表了文章 • 2018-09-10 14:18 • 0 条评论

0
推荐
1213
阅读

AI的思维

张磊 机器学习爱好者 人工智能爱好者社区专栏作者知乎:https://zhuanlan.zhihu.com/c_184412713个人网站:novasky.top   GitHub:https://github.com/zlxy9892 17世纪莱布尼茨设想,能否创造一种通用科学语言,可以把推理的过程,象数学一样用公式进行计算。随着计算机诞生,自动化的普及 ,通用人...

发表了文章 • 2018-09-06 15:44 • 0 条评论

0
推荐
4822
阅读

用户画像—计算用户偏好标签及数据指标与表结构设计

作者:超人赵,人工智能爱好者社区专栏作者知乎:https://www.zhihu.com/people/chao-ji-sai-ya-ren/posts一、用户画像—计算用户偏好标签下面介绍如何计算用户的偏好标签。在上一篇写用户画像的文章 “用户画像—打用户行为标签”中,主要讲了如何对用户的每一次操作行为、业务行为进行记录打上相应的标签。在这篇博客中,...

发表了文章 • 2018-09-06 15:39 • 0 条评论

0
推荐
3053
阅读

用户画像—打用户行为标签

作者:超人赵,人工智能爱好者社区专栏作者知乎:https://www.zhihu.com/people/chao-ji-sai-ya-ren/posts前文推送:用户画像之标签权重算法用户画像之标签聚类用户画像中用户行为标签是很重要的一块内容,这篇详细讲讲如何打行为标签。数据仓库用户画像的应用流程从原始的数据输入到模型应用可分为5块(图1),包括将操...

发表了文章 • 2018-09-06 15:36 • 0 条评论

0
推荐
1498
阅读

用户画像之数据质量管理

作者:超人赵,人工智能爱好者社区专栏作者知乎:https://www.zhihu.com/people/chao-ji-sai-ya-ren/posts前文推送:用户画像之标签权重算法用户画像之标签聚类大家好,今天和大家分享一下用户画像数据质量管理这块的内容。数据质量管理这项工作的重要性不言而喻,所谓“garbage in,garbage out”,基础数据的质量性如果...

发表了文章 • 2018-09-06 15:20 • 0 条评论