郭昱良的博客专栏

公众号:机器学习算法与Python学习。。不定期发布人工智能、机器学习、深度学习及Python编程方面的算法与实现,欢迎光大机器学习与数据挖掘领域的朋友加入交流与学习。

0
推荐
1193
阅读

再探matplotlib

matplotlib是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。它的文档相当完备,并且Gallery页面中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览/复制/粘贴一下,基本上...

发表了文章 • 2017-04-25 10:44 • 0 条评论

3
推荐
1341
阅读

Machine Learning -- Bayesian network

我们有:链接地址:http://www.dataguru.cn/thread-508373-1-1.html0 引言事实上,介绍贝叶斯定理、贝叶斯方法、贝叶斯推断的资料、书籍不少,比如《数理统计学简史》,以及《统计决策论及贝叶斯分析 James O.Berger著》等等,然介绍贝叶斯网络的中文资料则非常少,中文书籍总共也没几本,有的多是英文资料,但初学者一...

发表了文章 • 2017-04-25 10:37 • 0 条评论

2
推荐
1593
阅读

GBDT入门教程之原理、所解决的问题、应用场景讲解

GBDT (Gradient Boosting Decision Tree) 又叫 MART (Multiple  Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(generalization)较强的算法。近些年更因为被用于...

发表了文章 • 2017-04-24 09:49 • 0 条评论

0
推荐
5275
阅读

基于Python-ChatterBot搭建不同adapter的聊天机器人(使用NB进行场景分类)

chatterbot是一款python接口的,基于一系列规则和机器学习算法完成的聊天机器人。具有结构清晰,可扩展性好,简单实用的特点。本文通过chatterbot 的不同adapter来介绍如何构建自己的聊天机器人,关与chatterbot详细资料请请阅读源码,纯Python写的,阅读性比较强。好啦,我就直接上代码了。PS:现在正在收集语料库,过段...

发表了文章 • 2017-04-24 09:42 • 0 条评论

1
推荐
1248
阅读

Machine Learning -- GBDT(RF)

前言:决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时, 单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不够的。模型组合(比如说有Boosting,Bagging等...

发表了文章 • 2017-04-19 14:22 • 0 条评论

0
推荐
1263
阅读

Python:matplotlib

原文链接:http://blog.csdn.net/ywjun0919/article/details/8692018来源于书籍:《Python科学计算》matplotlib 是Python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。它的文档相当完备,并且Gallery页面中有上百幅缩略图,打...

发表了文章 • 2017-04-19 14:13 • 0 条评论

0
推荐
1271
阅读

Machine Learning -- Boosting

本来想写随机森林的但是由于其中用到了太多提升的思想,所以就先整理整理提升的相关概念。Boosting方法是一种用来提高弱分类算法准确度的方法,这种方法通过构造一个预测函数系列,然后以一定的方式将他们组合成一个预测函数。Boosting是一种提高任意给定学习算法准确度的方法。它的思想起源于 Valiant提出的 PAC&nbs...

发表了文章 • 2017-04-19 14:09 • 0 条评论

4
推荐
1659
阅读

Python:爬虫系列笔记(8) -- 爬去MM图片

tool.py转载于:静觅 » Python爬虫实战四之抓取淘宝MM照片链接:http://cuiqingcai.com/1001.html1.抓取淘宝MM的姓名,头像,年龄2.抓取每一个MM的资料简介以及写真图片3.把每一个MM的写真图片按照文件夹保存到本地4.熟悉文件保存的过程1.URL的格式在这里我们用到的URL是 http://mm.taobao.com/json/requ...

发表了文章 • 2017-04-19 14:00 • 0 条评论

2
推荐
2192
阅读

干货|详解CNN五大经典模型:Lenet,Alexnet,Googlenet,VGG,DRL

关于卷积神经网络CNN,网络和文献中有非常多的资料,我在工作/研究中也用了好一段时间各种常见的model了,就想着简单整理一下,以备查阅之需。Lenet,1986年Alexnet,2012年GoogleNet,2014年VGG,2014年Deep Residual Learning,2015年Lenet就从Lenet说起,可以看下caffe中lenet的配置文件(1),可以试着理解每一层的...

发表了文章 • 2017-04-19 13:47 • 0 条评论

0
推荐
1778
阅读

Python:爬虫系列笔记(3) -- urllib库的高级用法

1.设置Headers有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性。首先,打开我们的浏览器,调试浏览器F12,我用的是Chrome,打开网络监听,示意如下,比如知乎,点登录之后,我们会发现登陆之后界面都变化了,出现...

发表了文章 • 2017-04-17 08:54 • 0 条评论

0
推荐
2357
阅读

Machine learning -- C4.5算法详解及Python实现

程序实现部分转自 Wsine的博客小站地址:http://www.cnblogs.com/wsine/p/5180315.html C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习,找到一个从属性值到...

发表了文章 • 2017-04-17 08:51 • 0 条评论

1
推荐
2358
阅读

如何准备机器学习工程师的面试?

我之前面试一些公司的机器学习或者数据挖掘工程师的职位。感觉自己准备的不够充分。想了解下一般会问哪些问题,考察哪些方面的东西??周开拓~~~~~~~~~~~~~~~机器学习方面的面试主要分成三个部分: 1. 算法和理论基础 2. 工程实现能力与编码水平 3. 业务理解和思考深度1. 理论方面,我推荐最经...

发表了文章 • 2017-04-12 11:07 • 0 条评论

0
推荐
2049
阅读

深度学习框架Caffe/CNTK/Tensorflow/Theano/Torch的评估与比较

人工智能无疑是计算机世界的前沿领域,而深度学习无疑又是人工智能的研究热点,那么现在都有哪些开源的深度学习工具,他们各自的优缺点又是什么呢?本文对Caffe、CNTK、TensorFlow、Theano和Torch等深度学习工具从网络、模型能力、接口、部署、性能、架构、生态系统、跨平台等方面做了比较。1.网络和模型能力CaffeCaffe...

发表了文章 • 2017-04-12 11:05 • 0 条评论

0
推荐
1326
阅读

回归预测之入门

最近一段时间再看斯坦福大学几期学习的教学视频,有百度首席工程师、百度大脑以及百度研究院的负责人吴恩达教授讲述,内容深入浅出,推荐想踏入机器学习领域的童鞋观看。这儿为了加深对知识的认知,在这儿整理出来跟大家分享交流(中间活血有一些纰漏希望大家指出改正)。这个系列主要想能够用数学去描述机器学习,想要学...

发表了文章 • 2017-04-07 14:24 • 0 条评论

0
推荐
2076
阅读

高斯混合聚类(GMM)及代码实现

通过学习概率密度函数的Gaussian Mixture Model (GMM) 与 k-means 类似,不过 GMM 除了用在 clustering 上之外,还经常被用于 density estimation。对于二者的区别而言简单地说,k-means 的结果是每个数据点被 assign 到其中某一个 cluster ,而 GMM 则给出这些数据点被 assign 到每个 cluster 的概率。作为一个流行的算...

发表了文章 • 2017-03-22 20:11 • 0 条评论