0
推荐
1737
阅读

循环神经网络(RNN)

前言:前馈神经网络的输入和输出的维数都是固定的,不能任意改变。当处理序列数据时,前馈神经网络就无能力为了。因为序列数据是变长的。为了使得前馈神经网络能处理变长的序列数据,一种方法是使用延时神经网络(Time-Delay Neural Networks,TDNN)[Waibel et al., 1989]。循环神经网络(recurrent neural network, RN...

发表了文章 • 2017-05-02 15:11 • 0 条评论

1
推荐
2032
阅读

Machine Learning -- 主动学习(AL)

主动学习算法作为构造有效训练集的方法,其目标是通过迭代抽样,寻找有利于提升分类效果的样本,进而减少分类训练集的大小,在有限的时间和资源的前提下,提高分类算法的效率。主动学习已成为模式识别、机器学习和数据挖掘领域的研究热点问题。介绍了主动学习的基本思想,一些最新研究成果及其算法分析,并提出和分析了...

发表了文章 • 2017-04-28 09:53 • 0 条评论

0
推荐
1251
阅读

Machine Learning -- EM算法

0  EM算法综述迭代使用EM步骤,直至收敛。可以有一些比较形象的比喻说法把这个算法讲清楚。比如说食堂的大师傅炒了一份菜,要等分成两份给两个人吃,显然没有必要拿来天平一点一点的精确的去称分量,最简单的办法是先随意的把菜分到两个碗中,然后观察是否一样多,把比较多的那一份取出一点放到另一个碗中,这个过...

发表了文章 • 2017-04-25 10:59 • 0 条评论

3
推荐
1340
阅读

Machine Learning -- Bayesian network

我们有:链接地址:http://www.dataguru.cn/thread-508373-1-1.html0 引言事实上,介绍贝叶斯定理、贝叶斯方法、贝叶斯推断的资料、书籍不少,比如《数理统计学简史》,以及《统计决策论及贝叶斯分析 James O.Berger著》等等,然介绍贝叶斯网络的中文资料则非常少,中文书籍总共也没几本,有的多是英文资料,但初学者一...

发表了文章 • 2017-04-25 10:37 • 0 条评论

2
推荐
1591
阅读

GBDT入门教程之原理、所解决的问题、应用场景讲解

GBDT (Gradient Boosting Decision Tree) 又叫 MART (Multiple  Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(generalization)较强的算法。近些年更因为被用于...

发表了文章 • 2017-04-24 09:49 • 0 条评论

0
推荐
5274
阅读

基于Python-ChatterBot搭建不同adapter的聊天机器人(使用NB进行场景分类)

chatterbot是一款python接口的,基于一系列规则和机器学习算法完成的聊天机器人。具有结构清晰,可扩展性好,简单实用的特点。本文通过chatterbot 的不同adapter来介绍如何构建自己的聊天机器人,关与chatterbot详细资料请请阅读源码,纯Python写的,阅读性比较强。好啦,我就直接上代码了。PS:现在正在收集语料库,过段...

发表了文章 • 2017-04-24 09:42 • 0 条评论

1
推荐
1247
阅读

Machine Learning -- GBDT(RF)

前言:决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时, 单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不够的。模型组合(比如说有Boosting,Bagging等...

发表了文章 • 2017-04-19 14:22 • 0 条评论

1
推荐
2357
阅读

如何准备机器学习工程师的面试?

我之前面试一些公司的机器学习或者数据挖掘工程师的职位。感觉自己准备的不够充分。想了解下一般会问哪些问题,考察哪些方面的东西??周开拓~~~~~~~~~~~~~~~机器学习方面的面试主要分成三个部分: 1. 算法和理论基础 2. 工程实现能力与编码水平 3. 业务理解和思考深度1. 理论方面,我推荐最经...

发表了文章 • 2017-04-12 11:07 • 0 条评论

0
推荐
1325
阅读

回归预测之入门

最近一段时间再看斯坦福大学几期学习的教学视频,有百度首席工程师、百度大脑以及百度研究院的负责人吴恩达教授讲述,内容深入浅出,推荐想踏入机器学习领域的童鞋观看。这儿为了加深对知识的认知,在这儿整理出来跟大家分享交流(中间活血有一些纰漏希望大家指出改正)。这个系列主要想能够用数学去描述机器学习,想要学...

发表了文章 • 2017-04-07 14:24 • 0 条评论

0
推荐
2075
阅读

高斯混合聚类(GMM)及代码实现

通过学习概率密度函数的Gaussian Mixture Model (GMM) 与 k-means 类似,不过 GMM 除了用在 clustering 上之外,还经常被用于 density estimation。对于二者的区别而言简单地说,k-means 的结果是每个数据点被 assign 到其中某一个 cluster ,而 GMM 则给出这些数据点被 assign 到每个 cluster 的概率。作为一个流行的算...

发表了文章 • 2017-03-22 20:11 • 0 条评论

0
推荐
1359
阅读

特征学习

Contents1 关键词2 为什么需要进行特征学习3 无监督学习解决的问题4 功能强大的特征学习1. 关键词自我学习/自学习     self-taught learning无监督特征学习      unsupervised feature learning自编码器           &nb...

发表了文章 • 2017-03-17 13:20 • 0 条评论

5
推荐
1721
阅读

【爆】机器学习与大数据面试问题与答题思路

(更多消息关注公众号:机器学习算法与Python学习)1、平台搭建类  数据计算平台搭建,基础算法实现,当然,要求支持大样本量、高维度数据,所以可能还需要底层开发、并行计算、分布式计算等方面的知识;2、算法研究类  - 文本挖掘,如领域知识图谱构建、垃圾短信过滤等;  - 推荐,广告推荐、APP 推荐、题目推荐...

发表了文章 • 2017-03-14 20:24 • 3 条评论

2
推荐
1475
阅读

机器学习资料整理(欢迎补充)

 本博文所整理的机器学习书籍来自于博主平时的积累的一些资料,可能还有一些经典的机器学习书籍为包含其中,欢迎大家留言区补充,分享给大家。(本文所陈列的所有书籍电子版请链接:http://pan.baidu.com/s/1c10iQnm   )机器学习-Tom M.Mitchell     Tom M.Mitchell,是卡内基梅...

发表了文章 • 2017-03-02 15:07 • 0 条评论