0
推荐
1456
阅读

逻辑回归杂谈

本文聊聊逻辑回归(logistic regression)。逻辑回归虽然名字中带有回归二字,但是它并不是一种回归算法,而是一种分类算法,并且它是在工业界十分常用的一种分类算法。跟回归问题不同,logistic回归中的因变量是分类型变量(比如0,1这种二分类或者0,1,2,3这种多分类问题)。logistic回归的自变量和因变量之间不一定...

发表了文章 • 2017-09-18 10:23 • 0 条评论

1
推荐
1916
阅读

聊聊泛化低秩模型

在机器学习及数据挖掘领域中,数据集中的每个样本通常用一行数据来表示,其中每个数据表示某种特征的具体表现,所有数据样本会构成一个矩阵。一般情况下,会遇到其中含有多种类型的数据,比如数值型,布尔类型,类别型,序列型等,也会遇到其中包含缺失值的情形。现在处理的矩阵一般都是非常高维度的,直接对其处理计算...

发表了文章 • 2017-06-30 11:59 • 0 条评论

0
推荐
1657
阅读

聊聊奇异值分解在缺失值填补中的应用

奇异值分解算法在协同过滤中有着广泛的应用。协同过滤有这样一个假设,即过去某些用户的喜好相似,那么将来这些用户的喜好仍然相似。一个常见的协同过滤示例即为电影评分问题,用户对电影的评分构成的矩阵中通常会存在缺失值。                        &nb...

发表了文章 • 2017-03-20 10:29 • 0 条评论

0
推荐
2147
阅读

聊聊GBDT和随机森林

                                 GBDT 和 随机森林都是基于决策树而得到的。决策树比较容易理解,它具有比较直观的图示。利用决策树可以发现比较重要的变量,也可以挖掘变量之间的关系。决策树也比较不易受到离群点和缺失值的...

发表了文章 • 2017-03-20 10:20 • 0 条评论

0
推荐
1627
阅读

聊聊主成分分析

本文聊聊主成分分析(principal component analysis, PCA),首先谈谈协方差。方差和协方差是用来衡量一系列点在它们的重心或均值周围的分散程度的。方差可以标度这些点在一个维度的偏差, 而协方差是用来衡量一个维度是否会对另外一个维度有所影响的。协方差对两个维度进行衡量,进而查看这两个维度之间是否有关系。显然...

发表了文章 • 2017-03-06 09:53 • 0 条评论

0
推荐
1930
阅读

聊聊机器学习中特征的缺失值填补法

应用机器学习算法,必不可少的就是数据集。然而,通常情况下,收集到的数据集中或多或少会包含一些缺失值,比如年龄,性别,所在地等等。目前,研究者们已经研究出多种缺失值填补的方法。最简单的无疑是利用一些统计值来填补,比如利用均值,中位数,最大值,最小值等来填补,显然,这种方法填补虽然比较简单,但是它所...

发表了文章 • 2017-03-06 09:50 • 0 条评论

2
推荐
2041
阅读

聊一聊特征学习在用户偏好预测中的应用

本文聊聊如何利用客户购买行为预测其偏好。为了基于客户购买行为预测其偏好,可以利用机器学习中比较新兴的稀疏编码和稀疏限制性玻尔兹曼机将原始数据变换成稀疏高纬表示。这些特征学习技巧独立于预测模型,比如logit model,并且可以使得偏好预测的准确率得以提升。提取到的特征一般是比较抽象的,通常具有一定的解释性...

发表了文章 • 2017-02-27 15:15 • 1 条评论

0
推荐
2398
阅读

浅谈机器学习在市场营销中的应用

目前,在线展示广告越来越流行。在线展示广告的目的是获取更多的潜在客户,吸引客户购买商品。在线展示广告的一个基本要求就是通过广告获取用户所需费用要小于用户购买商品所耗费用,进而使得通过广告吸引来的客户为企业带来利润。在线展示广告中,比较流行的方式是通过手工精心设计更吸引人的广告,来招揽客户。然而,...

发表了文章 • 2017-02-27 15:11 • 0 条评论