0
推荐
1737
阅读
循环神经网络(RNN)
前言:前馈神经网络的输入和输出的维数都是固定的,不能任意改变。当处理序列数据时,前馈神经网络就无能力为了。因为序列数据是变长的。为了使得前馈神经网络能处理变长的序列数据,一种方法是使用延时神经网络(Time-Delay Neural Networks,TDNN)[Waibel et al., 1989]。循环神经网络(recurrent neural network, RN...
1
推荐
2032
阅读
Machine Learning -- 主动学习(AL)
主动学习算法作为构造有效训练集的方法,其目标是通过迭代抽样,寻找有利于提升分类效果的样本,进而减少分类训练集的大小,在有限的时间和资源的前提下,提高分类算法的效率。主动学习已成为模式识别、机器学习和数据挖掘领域的研究热点问题。介绍了主动学习的基本思想,一些最新研究成果及其算法分析,并提出和分析了...
0
推荐
1251
阅读
Machine Learning -- EM算法
0 EM算法综述迭代使用EM步骤,直至收敛。可以有一些比较形象的比喻说法把这个算法讲清楚。比如说食堂的大师傅炒了一份菜,要等分成两份给两个人吃,显然没有必要拿来天平一点一点的精确的去称分量,最简单的办法是先随意的把菜分到两个碗中,然后观察是否一样多,把比较多的那一份取出一点放到另一个碗中,这个过...
3
推荐
1340
阅读
Machine Learning -- Bayesian network
我们有:链接地址:http://www.dataguru.cn/thread-508373-1-1.html0 引言事实上,介绍贝叶斯定理、贝叶斯方法、贝叶斯推断的资料、书籍不少,比如《数理统计学简史》,以及《统计决策论及贝叶斯分析 James O.Berger著》等等,然介绍贝叶斯网络的中文资料则非常少,中文书籍总共也没几本,有的多是英文资料,但初学者一...
2
推荐
1591
阅读
GBDT入门教程之原理、所解决的问题、应用场景讲解
GBDT (Gradient Boosting Decision Tree) 又叫 MART (Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(generalization)较强的算法。近些年更因为被用于...
0
推荐
5274
阅读
基于Python-ChatterBot搭建不同adapter的聊天机器人(使用NB进行场景分类)
chatterbot是一款python接口的,基于一系列规则和机器学习算法完成的聊天机器人。具有结构清晰,可扩展性好,简单实用的特点。本文通过chatterbot 的不同adapter来介绍如何构建自己的聊天机器人,关与chatterbot详细资料请请阅读源码,纯Python写的,阅读性比较强。好啦,我就直接上代码了。PS:现在正在收集语料库,过段...
1
推荐
1247
阅读
Machine Learning -- GBDT(RF)
前言:决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时, 单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不够的。模型组合(比如说有Boosting,Bagging等...
1
推荐
2357
阅读
如何准备机器学习工程师的面试?
我之前面试一些公司的机器学习或者数据挖掘工程师的职位。感觉自己准备的不够充分。想了解下一般会问哪些问题,考察哪些方面的东西??周开拓~~~~~~~~~~~~~~~机器学习方面的面试主要分成三个部分: 1. 算法和理论基础 2. 工程实现能力与编码水平 3. 业务理解和思考深度1. 理论方面,我推荐最经...
0
推荐
1325
阅读
回归预测之入门
最近一段时间再看斯坦福大学几期学习的教学视频,有百度首席工程师、百度大脑以及百度研究院的负责人吴恩达教授讲述,内容深入浅出,推荐想踏入机器学习领域的童鞋观看。这儿为了加深对知识的认知,在这儿整理出来跟大家分享交流(中间活血有一些纰漏希望大家指出改正)。这个系列主要想能够用数学去描述机器学习,想要学...
0
推荐
2075
阅读
高斯混合聚类(GMM)及代码实现
通过学习概率密度函数的Gaussian Mixture Model (GMM) 与 k-means 类似,不过 GMM 除了用在 clustering 上之外,还经常被用于 density estimation。对于二者的区别而言简单地说,k-means 的结果是每个数据点被 assign 到其中某一个 cluster ,而 GMM 则给出这些数据点被 assign 到每个 cluster 的概率。作为一个流行的算...
0
推荐
1359
阅读
特征学习
Contents1 关键词2 为什么需要进行特征学习3 无监督学习解决的问题4 功能强大的特征学习1. 关键词自我学习/自学习 self-taught learning无监督特征学习 unsupervised feature learning自编码器 &nb...
5
推荐
1721
阅读
【爆】机器学习与大数据面试问题与答题思路
(更多消息关注公众号:机器学习算法与Python学习)1、平台搭建类 数据计算平台搭建,基础算法实现,当然,要求支持大样本量、高维度数据,所以可能还需要底层开发、并行计算、分布式计算等方面的知识;2、算法研究类 - 文本挖掘,如领域知识图谱构建、垃圾短信过滤等; - 推荐,广告推荐、APP 推荐、题目推荐...
2
推荐
1475
阅读
机器学习资料整理(欢迎补充)
本博文所整理的机器学习书籍来自于博主平时的积累的一些资料,可能还有一些经典的机器学习书籍为包含其中,欢迎大家留言区补充,分享给大家。(本文所陈列的所有书籍电子版请链接:http://pan.baidu.com/s/1c10iQnm )机器学习-Tom M.Mitchell Tom M.Mitchell,是卡内基梅...