9
推荐
3424
阅读

我的2017成长历程

回首一下我这个2017年,对比一下自己的2016年,发现自己的进步很大,自己的写代码水平,算法细节水平,对业务理解的水平都有了不少的提高,有些难以置信,或许这都要归功自己的平时喜欢学习,还有受到大神们给我的耐心解答,同事们的帮助,所以才会有那么大的进步;这一年对我来说其实挺幸运的,在这个社区认识了不少朋...

发表了文章 • 2018-01-29 16:06 • 14 条评论

1
推荐
3768
阅读

认识fasttext,以及如何在python2.7上安装

fasttext,从名字就是可以看得出来这个是一个快速文本分类器,该算法由facebook在2016年开源,提供了简单高效的文本分类,效果堪比深度学习;这些比较在作者的原始paper上可以得出结果;这里只是做一个简短的介绍,这个是words2vec衍生出来的一个算法;这个算法的作者也是words2vec作者,他认为原始论文:https://arxiv.o...

发表了文章 • 2017-10-14 17:57 • 1 条评论

0
推荐
2115
阅读

【斯坦福---机器学习】复习笔记之牛顿方法(转)

前言:因为最近在看斯坦福的机器学习的公开课,所以转一些笔记本讲大纲:1.牛顿方法(Newton’s method) 2.指数族(Exponential family) 3.广义线性模型(Generalized linear models)1.牛顿方法假设有函数:,我们希望找到满足的值. 这里是实数. 牛顿方法执行下面的更新:  下图为执行牛顿方法的过...

发表了文章 • 2017-08-01 08:55 • 0 条评论

7
推荐
4802
阅读

用Python实现本文分词以及本地保存

我们通常在做中文文本分析的时候,首先都需要先对文本进行分词,分割成我们想要的形式,这里的话我就使用python进行文本分词,并保存在本地相应文件夹中,这里的话我使用的数据集是answer;好像复旦大学某个人收集的,抱歉,我没记住名字,至少说明我还是有点责任感,哈哈;入正题因为使用的python进行分词的话,我们就...

发表了文章 • 2017-05-25 21:46 • 3 条评论

1
推荐
2056
阅读

初识pandas包的数据预处理

前言 这篇文章是通过一个简单的数据认识pandas在数据预处理上的一个运用,这个也是写给自己以后当作参考手册用的,部分步骤缺少Python代码,后面会加上,本文可能较为简单,不适合大神;本文的数据是书名《机器学习系统设计》第一章的数据,数据处理上不参考书里环境背景:python环境:2.7工具:Pycharm1、读入数据导入我...

发表了文章 • 2017-05-23 20:50 • 3 条评论

22
推荐
1876
阅读

再见2016,你好2017

不知不觉又到了写一年的总结的时候了,也是从2016年开始在天善坚持写博客学习的一年,对我来说是一个极其有意义的一年。首先回首一下我的2016年过程1、3月,在天善完成了自己的第一篇博客2、5月,回了趟西安看望了母校并和舍友们相聚3、7月,在咨询了小郭姐等人毅然的决定要跳槽了4,8月,入职新公司,这次接触更多的数...

发表了文章 • 2017-01-07 19:36 • 8 条评论

4
推荐
1747
阅读

简单的介绍一下评价分类器常用指标

我们日常用的分类算法有很多种,不同的份额里算法又用不同的测度指标,所以在不同的数据集上会有表现也会有所不同;所以这时候对分类器的性能判断尤为重要,所以有几个简单的性能评价指标,简单说下在说之前先说下几个字母和一个常见术语1、TP:被正确划分为正例的个数,既实际为正例且被分为正例的样本数2、FP:被错误划...

发表了文章 • 2016-12-12 21:48 • 0 条评论

5
推荐
4893
阅读

常用的几种商品推荐算法介绍

1、现有推荐算法商品推荐系统根据算法分为基于内容,协同过滤和混合的推荐系统,这些算法目前都具有些局限性1.1基于内容的推荐算法算法的核心思想和关键步骤基于内容的推荐算法起源于信息检索,通常用来推荐包括文本信息的文档信息的文档,网页和新闻等,即向用户推荐与他们过去喜爱的商品相似的商品,这个有两个关键步...

发表了文章 • 2016-09-27 21:57 • 0 条评论

5
推荐
2349
阅读

简单的认识一下组合分类器以及R语言对应使用函数

首先,我们大家都有学习过一系列的分类方法,例如决策树,贝叶斯分类器等,有时候分类的效果不太如人意,哪怕是参数是最优化也一样,所以这时候就需要一些提高分类准确性的方法,我们常用的就是组合分类器,它就是一个复合模型,也就是由多个分类器组合而成;个体的分类器对结果进行投票,然后对组合分类器返回的投票进...

发表了文章 • 2016-09-17 22:18 • 0 条评论

4
推荐
1796
阅读

分享一些LINUX常用命令行

最近在学习一些关于大数据的知识,感觉LINUX系统不做维护的话不需要掌握太深,所以这里就分享一些常用命令行给大家LINUX一些常用指令LS 显示文件或者目录 -l 列出文件详细信息 -a 列出当前目录下所有文件及目录mkdir -p 创建目录,若无父目录cd               切换目录touch  ...

发表了文章 • 2016-08-15 16:04 • 5 条评论

7
推荐
1818
阅读

推荐一本机器学习很好的书-《统计学习方法》

这里就不贴资源了,涵盖了大部分机器的学习算法,图文并茂,并且用简答的实例来还原求解过程,是一本较为容易看得懂的书

发表了文章 • 2016-06-06 18:09 • 4 条评论

5
推荐
1852
阅读

菜鸟R语言入门--资源自取

链接: http://pan.baidu.com/s/1hrJ1rwC 密码: jgec感谢原作者炼数成金的分享

发表了文章 • 2016-04-22 17:07 • 2 条评论