0
推荐
3332
阅读

准确率 召回率

最近一直在做相关推荐方面的研究与应用工作,召回率与准确率这两个概念偶尔会遇到,知道意思,但是有时候要很清晰地向同学介绍则有点转不过弯来。召回率和准确率是数据挖掘中预测、互联网中的搜索引擎等经常涉及的两个概念和指标。召回率:Recall,又称“查全率”——还是查全率好记,也更能体现其实质意义。准确率:Precisi...

发表了文章 • 2015-10-31 14:25 • 0 条评论

0
推荐
6779
阅读

Gbdt防止过拟合的几种方法

Gbdt防止过拟合的几种方法1 、控制tree的棵树,即迭代次数M。An optimal value of M is often selected by monitoring prediction error on a separate validation data set.2、控制shrink,Empirically it has been found that using small learning rates (such as ) yields dramatic improvements in model...

发表了文章 • 2015-10-31 14:21 • 0 条评论

0
推荐
4377
阅读

GBDT算法通俗介绍

“机器学习”这个名词对大家来说想必不是一个陌生的词汇,特别对算法组的同学来说,工作中或多或少接触使用过这种“高科技“。对于我来说,刚来淘宝工作一个月就开始接触了机器学习,当时做主搜索功夫熊猫项目,和小致飘雪一起做交易模型,正是使用了机器学习的方法,也首次接触了treelink模型。做完那个项目后对机器学习解...

发表了文章 • 2015-10-31 14:20 • 0 条评论

0
推荐
3553
阅读

随机森林(RF, RandomForest)介绍

随机森林 随机森林(RF, RandomForest)包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。通过自助法(boot-strap)重采样技术,不断生成训练样本和测试样本,由训练样本生成多个分类树组成的随机森林,测试数据的分类结果按分类树投票多少形成的分数而定。     ...

发表了文章 • 2015-10-31 14:17 • 0 条评论

0
推荐
6376
阅读

[转载]机器学习基本算法

1 Logistic回归:优点:计算代价不高,易于理解和实现。缺点:容易欠拟合,分类精度可能不高。适用数据类型:数值型和标称型数据。类别:分类算法。适用场景:解决二分类问题。简述:Logistic回归算法基于Sigmoid函数,或者说Sigmoid就是逻辑回归函数。Sigmoid函数定义如下:1/(1+exp(-z))。函数值域范围(0,1)。...

发表了文章 • 2015-10-31 14:14 • 0 条评论

0
推荐
2991
阅读

时间序列预测方法

时间序列预测技术之一 时间序列(Time-Series Forecasting)的预测问题!预测:是对尚未发生或目前还不明确的事物进行预先的估计和推测,是在现时对事物将要发生的结果进行探讨和研究,简单地说就是指从已知事件测定未知事件。为什么要预测呢,因为预测可以帮助了解事物发展的未来状况后,人们可以在目前为它的到来做...

发表了文章 • 2015-10-30 20:07 • 1 条评论