数据取经团

每天都有收获,每天有所突破,加油,坚持。

1
推荐
2052
阅读

自我代码提升之启发式算法(番外篇)

本文作者:数据取经团 - JQstyle       本期给大家带来一些启发式算法的介绍和代码实现。严格来说,启发式算法并不属于机器学习领域的方法,其解决的问题也并不是分类和回归预测,因此本篇属于该系列番外篇。启发式算法简介  在数学建模的经典问题当中,有一种问题是最优化问题,即在给定...

发表了文章 • 2018-03-08 13:42 • 0 条评论

0
推荐
2154
阅读

自我代码提升之梯度提升树

本文作者:数据取经团 - JQstyle       之前已经为大家带来了决策树和基于决策树并行实现的随机森林的介绍。本期将为大家带来基于决策树基础模型的第二种算法,梯度提升树(即GBDT算法)。GBDT的基本原理  梯度提升树属于Boosting集成学习算法的一种,其思想不同于随机森林、Bagging的并...

发表了文章 • 2018-03-08 13:38 • 0 条评论

0
推荐
1895
阅读

机器学习模型效果评估指标

本文作者:数据取经团 - 张俊红前言前面的推文中介绍了几种常用的机器学习算法,每个算法都有各自的优劣势,我们应该选择根据每个算法的优劣势去合理的选择适合我们需求的算法,以此达到效果最优,那么什么样的效果才是最优的,用什么来衡量这个效果。这一篇就针对机器学习算法的效果评估指标进行介绍。准确率...

发表了文章 • 2018-03-08 11:55 • 0 条评论

3
推荐
2441
阅读

机器学习实战--KNN算法详解

作者:数据取经团-Monke写在前面走了很多弯路,看了很多风景,才发现,想要好好学算法,还是要一行一行敲代码,于是有了这个系列。这个系列按照机器学习实战的章节来写,由于市面上已经有很多同类的文章,一般以介绍算法,贴代码,举例子为主,个人读下来,觉得对于实现的代码还是不能有很好的理解,所有有了这个系列。...

发表了文章 • 2017-12-26 14:34 • 0 条评论

2
推荐
2059
阅读

圣诞老公公的礼物名单

“Jingle bells, jingle bells Jingle all the wayOh what fun it is to ride in a one horseopen sleighhey~”叮叮叮,又到了一年一度的圣诞节,可爱的大家都在朋友圈@微信团队,求一顶萌萌哒圣诞帽~那么大家心仪的圣诞礼物是神马呢?然鹅,现在越来越多滴小盆友,可以选择的礼物种类也越来越多,真的让圣诞老公公...

发表了文章 • 2017-12-25 15:53 • 1 条评论

7
推荐
2002
阅读

数据分析师—技术面试

作者:数据取经团-吕洞宾前记三月份开始找实习,到现在已经有半年的时间了,在这半年的时间中,该经历的基本上都已经经历,春招实习时候,拿到了7个offer,校招时候,成功的拿下一份心仪的工作,结束了我的秋招旅程。对于面试,技术层面即算法、软件等等,业务层面就是忽悠(毕竟没有做过完整的项目),但是也要有自己的...

发表了文章 • 2017-12-05 10:24 • 0 条评论

0
推荐
3044
阅读

基于xgb+lime的中文情感分析结果可解释性展示

作者:数据取经团-数据栗子前言喂,这位同学,这个感觉上应该是A,你的模型怎么预测的是B?做模型的小伙伴,平时肯定少不了这样的追问;为了模型准确率只能放弃可解释性,线性模型固然好解释,但是大家都知道现实中线性的问题还是很少,大部分都是很复杂的非线性问题,面对这样的问题,该怎么办???下面我就带大家一块...

发表了文章 • 2017-11-29 09:37 • 0 条评论

5
推荐
15673
阅读

Python实现贴吧多线程网盘爬虫

大多数Python学习者都是冲着Python在爬虫领域有非常出色的表现才开始学习的,在学好Python的基本语法并会使用re、requests、BeautifulSoup4等模块后,很快就能写出一个简单的爬虫小程序(不要看不起这个,毕竟这是我们每个人从0到1的必经阶段)。这篇文章的受众是:有Python基础,会用requests框架,会写简单的单进程单...

发表了文章 • 2017-11-29 09:24 • 0 条评论

1
推荐
1649
阅读

python创建可以打开文件的EXE

本文作者:数据取经团 - 王智博首先抛出一个要解决的问题,在学python时用jupyter notebook记了很多笔记,而实际操作时有一些细节不记得了,需要查看笔记。但是一个.ipynb文件用文本编辑器打开,多了很多我们不想看到的文本,而用jupyter打开又很慢。于是需要设置出一个可执行程序(exe文件)来打开.ipynb文件。本文展示...

发表了文章 • 2017-11-22 16:49 • 0 条评论

0
推荐
1780
阅读

爬取近万条京东iphone8的异步加载评论

本文作者:数据取经团 - 王大伟前言好久没写爬虫类的文章了,时间长了,生疏了本想搞个大新闻然后忙了一天没怎么有空坐在电脑前就放弃了不过!还是可以搞个小新闻的看过我文章的人都知道我写文章很浅显易懂喜欢从零开始一步步玩虽然技术不如各种大V虽然我名字透露着我可能是个隐藏的大V不过尽量让不懂的人看懂文章并且能...

发表了文章 • 2017-11-22 16:19 • 1 条评论

1
推荐
2275
阅读

自我代码提升之随机森林

本文作者:数据取经团 - JQstyle      本期将为大家带来建立在决策树基础上的一种集成学习方法,随机森林模型。随机森林的思想介绍  从集成学习的基本思想来看,将多个弱学习器组合作为新的模型来提升预测效果,就模型的组合方式而言,可以分为Boosting和Bagging两个大类。随机森林作为一种类Bagging的模...

发表了文章 • 2017-11-22 16:06 • 0 条评论

0
推荐
1617
阅读

利用多种方法来进行分类算法

前一段时间,作者利用Python进行了分类的数据挖掘算法,根据天善智能的《案例为师,实战为王》的课程代码,自己将泰坦尼克号的建模过程进行了整理,主要由回归分析,逻辑回归算法,决策树算法(参数选择),随机森林算法的Python代码实现进行了整合。第一步:数据提取和描述性统计在这一步中,Python中的一些简单函数可...

发表了文章 • 2017-11-21 16:37 • 0 条评论

0
推荐
2598
阅读

kd-tree:k近邻查询和范围查询

想象一下我们有如下两个任务:我现在想骑一辆小黄车,我想查找离我最近的k辆小黄车.找到百度地图中显示在屏幕上区域中的所有酒店这两个任务均可以用kd-tree来解决kd-tree 主要两个用途:查询离某个点的最近的 个邻居,搜索某个区域内的所有点.后者在计算几何中称为范围查询,例如查询某个平面区域内的点的个数.kd-tree是什么...

发表了文章 • 2017-11-21 16:01 • 0 条评论

0
推荐
2188
阅读

自我代码提升之决策树

作者:数据取经团 - JQstyle本期将为大家带来决策树算法的介绍和实现,在机器学习领域、决策树为代表的一系列算法是不可忽视的一部分。当前在实际应用中较为主流的几种算法,如随机森林(RF)、梯度迭代决策树(GBDT)和XGBoost等,均是以决策树作为基础模型。决策树简单介绍决策树是一种基本的分类和回归方法,在本章中...

发表了文章 • 2017-11-21 15:46 • 0 条评论

0
推荐
1951
阅读

机器学习面试题目总结

作者:数据取经团 - Monke(本文阅读时长:10分钟)1.机器学习中特征的理解def:特征选择和降维特征选择:原有特征选择出子集,不改变原来的特征空间降维:将原有的特征重组成为包含信息更多的特征,改变了原有的特征空间降维的主要方法Principal Component Analysis(主成分分析)Singular Value Decomposition(奇异值分...

发表了文章 • 2017-09-18 11:04 • 0 条评论