1
推荐
1781
阅读

提升方法-Adaboost算法

总第85篇01|基本概念:提升方法的基本思想:对于任何一个复杂任务来说,将多个专家的判断进行适当的综合所得出的判断,要比任何一个专家单独的判断好。先来看两个概念:强可学习和弱可学习。在概率近似正确学习的框架中(简称PAC),一个概念(类),如果存在一个多项式的学习算法能够学习它,并且正确率很高,那么就称这...

发表了文章 • 2017-11-07 14:51 • 0 条评论

0
推荐
1849
阅读

逻辑斯蒂回归模型

总第83篇01|基本概念:在介绍逻辑回归模型以前,先介绍一下逻辑斯谛分布。设X是连续型随机变量,X服从逻辑斯蒂分布是指X具有下列分布函数F(x)和密度函数f(x):逻辑斯谛分布的分布函数F(x)的曲线如图所示,其图形是一条S形曲线,曲线在中心附近增长最快,在两端增长速度较慢。当x无穷大时,F(x)接近于1;当x无穷小时,F(x...

发表了文章 • 2017-11-07 14:44 • 0 条评论

0
推荐
1579
阅读

EM算法

总第82篇01|概念及原理:EM算法是一种迭代算法,用于含有隐变量的概率模型参数的极大似然估计,或极大后验概率估计。EM算法的每次迭代分两步完成:E步,求期望(expectation);M步,求极大值(maximization).所以这一算法称为期望极大算法,简称EM算法。(你看懂了吗?反正我第一次看是一脸懵。没关系接下来通过一个例子,你...

发表了文章 • 2017-11-07 14:38 • 0 条评论

0
推荐
1727
阅读

支持向量机详解

总第81篇(本文框架)01|概念及原理:支持向量机是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器。说的通俗一点就是就是在特征空间里面用某条线或某块面将训练数据集分成两类,而依据的原则就是间隔最大化,这里的间隔最大化是指特征空间里面距离分离线或面最近的点到这条线或面的间隔(距离)最大...

发表了文章 • 2017-11-07 14:35 • 0 条评论

0
推荐
1730
阅读

决策树-CART算法

总第80篇01|前言:本篇接着上一篇决策树详解,CART是英文“classification and regression tree”的缩写,翻译过来是分类与回归树,与前面说到的ID3、C4.5一致,都是决策树生成的一种算法,同样也由特征选择、树的生成以及剪枝组成,既可以用于分类也可以用于回归。CART算法由决策树的生成以及决策树剪枝两部分组成。02|CA...

发表了文章 • 2017-09-18 10:51 • 0 条评论

0
推荐
1386
阅读

决策树详解

总第79篇01|背景:我们在日常生活中经常会遇到一些选择需要去做一些选择,比如我们在找工作的时候每个人都希望能找到一个好的工作,但是公司那么多,工作种类那么多,什么样的工作才能算是好工作,这个时候就需要我们对众多的工作去做一个判断。最常用的一种方法就是制定几个可以衡量工作好坏的指标,比如公司所处的行业...

发表了文章 • 2017-09-18 10:39 • 0 条评论

1
推荐
1375
阅读

朴素贝叶斯详解

总第78篇一、统计知识01|随机事件:1、概念随机事件是在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件)。随机事件通常用大写英文字母A、B、C等表示。随机试验中的每一个可能出现的试验结果称为这个试验的一个样本点,记作ωi。全体样本点组成的集合称为这个试验的样本...

发表了文章 • 2017-08-28 16:17 • 0 条评论

0
推荐
1654
阅读

最懒惰的算法—KNN

总第77篇本篇介绍机器学习众多算法里面最基础也是最“懒惰”的算法——KNN(k-nearest neighbor)。你知道为什么是最懒的吗?01|算法简介:KNN是英文k-nearest neighbor的缩写,表示K个最接近的点。该算法常用来解决分类问题,具体的算法原理就是先找到与待分类值A距离最近的K个值,然后判断这K个值中大部分都属于哪一类,那...

发表了文章 • 2017-08-15 10:27 • 0 条评论

0
推荐
1229
阅读

机器学习开篇

总第76篇声明:1、接下来的关于机器学习的专题内容都会借鉴李航老师的《统计学习方法》。2、李航老师的书籍中把机器学习称为统计机器学习,我们在文章中简称为统计学习。01|统计学习概览:1、统计学习的概念统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。2、统计学习的对象统...

发表了文章 • 2017-08-15 10:18 • 0 条评论

0
推荐
1171
阅读

一些算法的总结

算法目的:分类、预测算法分类:监督型、非监督型算法的核心:你有什么数据、你要解决什么问题01|线性回归:1、什么是回归回归,指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法,又称多重回归分析。2、回归算法根据给予的训练集训练出一定的回归模型(即找出最佳回归直线 ),...

发表了文章 • 2017-03-23 11:26 • 0 条评论