郭昱良的博客专栏

公众号:机器学习算法与Python学习。。不定期发布人工智能、机器学习、深度学习及Python编程方面的算法与实现,欢迎光大机器学习与数据挖掘领域的朋友加入交流与学习。

0
推荐
1919
阅读

机器学习(2)之过拟合与欠拟合

过拟合与欠拟合上一篇(机器学习(1)之入门概念),我们介绍了机器学习所解决的问题,以及哪些种类的机器学习方法。本文我们主要从模型容量的选择出发,讲解欠拟合和过拟合问题。机器学习的主要挑战任务是我们的模型能够在先前未观测的新输入上表现良好,而不是仅仅在训练数据集上效果良好。这儿,将在先前未观测输入上...

发表了文章 • 2017-07-06 14:03 • 0 条评论

0
推荐
3718
阅读

机器学习(1)之入门概念

机器学习是什么机器学习是什么?实际上,即使是研究机器学习的专业人士(如Hinton,Bengio,LeCun,Andrew Ng等)在定义这个问题时也会有不同认知,目前还不存在一个被广泛认可的定义,为此,我想借助斯坦福大学的Machine learning课程中的一些案例来说明这个问题。先看一下机器学习在学术上定义的发展历程,Arthur...

发表了文章 • 2017-07-06 11:53 • 0 条评论

0
推荐
2606
阅读

基于TensorFlow实现自编码器(附源码)

传统的机器学习很大程度上依赖于好的特征工程,而特征工程是一项十分耗费精力与时间的事情,最主要的是在语音、图像和视频中提取有效地特征就更难了。而深度学习,包括有监督的深度学习和无监督的深度学习,可以完美的解决人工难以有效提取特征的问题,他可以大大缓解机器学习模型对特征工程的依赖性。例如在图像识别问...

发表了文章 • 2017-06-16 09:32 • 0 条评论

0
推荐
1900
阅读

梯度提升树GBDT原理

作者:雪伦_链接:http://blog.csdn.net/a819825294提升方法实际采用加法模型(即基函数的线性组合)与前向分布算法。以决策树为基函数的提升方法称为提升树(boosting tree)。对分类问题决策树是二叉分类树,对回归问题决策树是二叉决策树。提升树模型可以表示为决策树的加法模型: 其中,T(x;Sm)表示决策树;Sm为...

发表了文章 • 2017-06-16 09:24 • 0 条评论

0
推荐
2024
阅读

n-gram文法中数据稀疏问题解决方案之一:Good-Turing平滑

统计语言模型中,N元语法模型不可避免的一个问题,就是数据稀疏,其原因是大规模语料统计与有限语料的矛盾。根据Zipf法则,我们能够推测知零概率问题不可避免。数据稀疏问题的解决办法就是进行平滑处理。平滑处理的算法有很多,例如:加1法、加法平滑方法、Good-Turing估计法、Katz平滑方法、Jelinek-Mercer平滑方法、Wi...

发表了文章 • 2017-06-09 11:50 • 0 条评论

0
推荐
2478
阅读

6千万词汇的巨型汉语词库

算法+语料≈NLP这是一个六千万词汇量的分类词库,从事NLP时间久了你会感觉到,算法无法解决所有问题,词库也非常重要。通常一个算法可以解决80%的问题,剩下的20%无论怎么调节优化,都是拆东墙补西墙。比如“区人保”被HMM人名识别模块误命中的例子,这个词让HMM来看,“区”作为姓氏,“人”“保”作为名字的二三字的确非常有可...

发表了文章 • 2017-06-05 11:04 • 1 条评论

0
推荐
2226
阅读

综述 | 常用文本特征选择

作者:ACdreamers链接:http://blog.csdn.net/acdreamers/article/details/44661843在机器学习中,特征属性的选择通常关系到训练结果的可靠性,一个好的特征属性通常能起到满意的分类效果。凡是特征选择,总是在将特征的重要程度量化后再进行选择,而如何量化特征的重要性,就成了各种方法间最大的不同。接下来就介绍如...

发表了文章 • 2017-06-05 10:52 • 0 条评论

0
推荐
1730
阅读

Torch7模型训练

Torch7搭建卷积神经网络详细教程已经详细的介绍啦Module模块,这里再次基础上再给出一些上Container、 Transfer Functions Layers和 Simple Layers模块的理解。并在后面给出一些简单的模型训练方法。下述程序在itorch qtconsole下运行。上一篇博文讲到Module主要有四个函数(详细见Torch7搭建卷积神经网络详细教程),但是...

发表了文章 • 2017-05-27 11:16 • 0 条评论

1
推荐
1886
阅读

Torch7搭建卷积神经网络详细教程

之前的博文,如一文读懂卷积神经网络(CNN)、多层网络与反向传播算法详解、感知机详解、卷积神经网络详解等已经比较详细的讲述了神经网络以及卷积神经网络的知识。本篇博文主要讲述在Torch7中神经网络如何建立以及相关的原理(即神经网络包NN的内容),虽然讲述的是神经网络的建立。但是不会涉及太多神经网络的知识,假如...

发表了文章 • 2017-05-27 11:05 • 0 条评论

0
推荐
1528
阅读

Torch7基本教程2

上一篇博文Torch7深度学习教程1详细的讲述了Torch7的安装过程,本篇博文主要是讲述一下Torch7中的一些基本运算的语法,与Python的基本语法类似,加入你不是python的小白,本篇可以一带而过的略一遍。启动Torch7,终端下输入:th,这种交互式的模式跟python和MATLAB的IDE很相像,使用起来更加的顺手。1. 关于String2. 关...

发表了文章 • 2017-05-27 10:49 • 0 条评论

1
推荐
1879
阅读

Torch7深度学习教程1

Torch7的本系列教程的主要目的是介绍Torch的入门使用。今天首先分享一下Torch7的安装。(在Ubuntu14.04安装torch7)为什么选择TorchTorch的目标是在建立科学算法的同时,要有最大的灵活性和速度,而这一过程非常简单。Torch拥有一个大社区驱动包的生态系统,涉及机器学习、计算机视觉、信号处理、并行处理、图像、视频、...

发表了文章 • 2017-05-27 10:16 • 0 条评论

0
推荐
1815
阅读

集成学习(EL)综述

机器学习方法在生产、科研和生活中有着广泛应用,而集成学习则是机器学习的首要热门方向。集成学习是使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。本文章是对分类的集成学习(图1所示)的概念以及一些主要的集成学习方法的简介。Ensemble Learn...

发表了文章 • 2017-05-27 10:08 • 0 条评论

1
推荐
1880
阅读

干货 | 一文读懂什么是贝叶斯机器学习

你知道贝叶斯法则。机器学习与它有何相关?它可能很难掌握如何把拼图块放在一起——我们了解它花了一段时间。贝叶斯和频率论者在本质上,贝叶斯意味着概率。这个具体的术语存在是因为有两个概率方法。贝叶斯认为这是一个衡量的信念,因此,概率是主观的,并且指向未来。频率论者有不同看法:他们用概率描述过去发生的事件—...

发表了文章 • 2017-05-25 09:49 • 0 条评论

0
推荐
1993
阅读

PCA实现一个简单的酒店推荐系统(附Python源码)

众所周知,PCA 的主要目的是降维,同时也可以起到分类的作用。当数据维度很大的时候,如果相信大部分变量之间存在线性关系,那么我们就希望降低维数,用较少的变量来抓住大部分的信息。(一般来讲做PCA 之前要做normalization 使得变量中心为0,而且方差为1.)比较广泛应用于图像识别,文档处理,推荐系统等。推荐系统如...

发表了文章 • 2017-05-22 09:44 • 1 条评论

1
推荐
2637
阅读

基于机器学习的文本情感极性分析

2.1.1 停用词具体请看Python做文本挖掘的情感极性分析(基于情感词典的方法)(同1.1.4)2.1.2 正负向语料库来源于有关中文情感挖掘的酒店评论语料,http://www.datatang.com/data/11936其中正向7000条,负向3000条,当然也可以参考情感分析资源使用其他语料作为训练集。2.1.3 验证集Amazon上对iPhone 6s的评论,来源已...

发表了文章 • 2017-05-22 09:39 • 1 条评论