Python爱好者社区

公众号:Python爱好者社区;人生苦短,我用Python。分享Python相关的技术文章、工具资源、精选课程、视频教程、热点资讯、学习资料等。每天自动更新和推送。

1
推荐
1445
阅读

Machine Learning-模型结果的应用之道

作者:阿Sam 个人公众号:SAMshare前文传送门:Machine Learning-算法汇总介绍Machine Learning-模型调优备忘录当你有了一个相当不错的模型结果了,这个时间就需要上线应用了,但实际上这个过程也是需要注意很多东西的呢,比如汇报你的项目结果、上线计划沟通、上线后的监控等等,都是相当重要的,Brownlee教授有一...

发表了文章 • 2018-05-30 15:23 • 0 条评论

0
推荐
1561
阅读

Machine Learning-模型调优备忘录

作者:阿Sam 个人公众号:SAMshare前文传送门:Machine Learning-算法汇总介绍之前讲了一些机器学习的算法和特征工程的东西,相信大家如果有一些数据也是可以建立出自己的模型了,但是,模型的效果却没有想象中那么好,那么,应该怎么做呢?这里有一份关于模型调优的备忘录,每当出现上述问题的时候或者是建模前,...

发表了文章 • 2018-05-29 10:15 • 0 条评论

0
推荐
1722
阅读

Machine Learning-算法汇总介绍

作者:阿Sam 个人公众号:SAMshare之前一个一个讲还是有些零散而且更新的速度也慢,所以我还是打算先整理一波全部的算法,再逐一展开介绍比较好,原文来自Jason Brownlee 的文章《A Tour of Machine Learning Algorithms》。那么算法很多,如何做好分组有助于我们更好记住它们,作者给出了2条算法分组的方式:The f...

发表了文章 • 2018-05-28 16:12 • 0 条评论

0
推荐
1865
阅读

数据城堡参赛代码实战篇(四)---使用pandas合并数据表

作者:文文个人公众号:小小挖掘机(ID:wAIsjwj)前文传送门:数据城堡参赛代码实战篇(三)---使用pandas合并数据表 数据城堡参赛代码实战篇(二)---使用pandas进行数据去重 数据城堡参赛代码实战篇(一)---手把手教你使用pandas 关注Python爱好者社区,回复"数据代码",即可获得本文数据代码。小编们...

发表了文章 • 2018-05-21 15:08 • 0 条评论

0
推荐
1790
阅读

数据城堡参赛代码实战篇(三)---使用pandas合并数据表

作者:文文个人公众号:小小挖掘机(ID:wAIsjwj)前文传送门:数据城堡参赛代码实战篇(一)---手把手教你使用pandas数据城堡参赛代码实战篇(二)---使用pandas进行数据去重关注Python爱好者社区,回复"数据代码",即可获得本文数据代码。小编们最近参加了数据城堡举办的“大学生助学金精准资助预测”比赛,分组第19名的...

发表了文章 • 2018-05-17 09:46 • 0 条评论

3
推荐
1790
阅读

如何入手数据科学竞赛——以kaggle为例

一些初学者会犹豫要不要参加 Kaggle 竞赛,这并不让人奇怪,他们通常有以下顾虑:我该如何开始?我要和经验丰富的博士研究者比赛吗?如果没有获胜的机会,还值得参与吗?这就是数据科学吗?(如果我在 Kaggle 上表现不好,我在数据科学领域还有希望吗?)未来我该如何提升我的排名?如果你有其中任何问题,你就看对了文...

发表了文章 • 2018-05-16 15:44 • 0 条评论

1
推荐
2076
阅读

2018 Python AI 与机器学习开源项目排名 Top 20

作者:Ilan Reinstein来源:KDnuggets参与:Cynthia、大伟、周剑翻译:本文为天善智能编译,未经容许,禁止转载。想要深入了解机器学习与AI 并非易事。许多满怀抱负的专业人士和爱好者们发现,尽管拥有海量的资源,要在该领域建立正确的路径仍十分困难。这个行业日新月异的发展速度使得跟紧它的发展步伐成为决定性的指标...

发表了文章 • 2018-05-15 16:34 • 0 条评论

1
推荐
2170
阅读

数据城堡参赛代码实战篇(二)---使用pandas进行数据去重

作者:文文个人公众号:小小挖掘机(ID:wAIsjwj)前文传送门:数据城堡参赛代码实战篇(一)---手把手教你使用pandas关注Python爱好者社区,回复"数据代码",即可获得本文数据代码。文文和小伙伴最近参加了数据城堡举办的“大学生助学金精准资助预测”比赛,分组第19名的成绩进入了复赛,很激动有木有!在上一篇文章中,文...

发表了文章 • 2018-05-14 16:40 • 1 条评论

0
推荐
2164
阅读

数据城堡参赛代码实战篇(一)---手把手教你使用pandas

作者:文文个人公众号:小小挖掘机(ID:wAIsjwj)最近参加了数据城堡(http://www.pkbigdata.com/)举办的“大学生助学金精准资助预测”比赛,分组第19名的成绩进入了复赛,很激动有木有!本篇,文文将带你一起分析如何用pandas来对官方给出的数据进行处理和分析。1 引言在进入正题之前呢,我们先来了解两件事情:pandas和...

发表了文章 • 2018-05-09 17:02 • 7 条评论

0
推荐
1717
阅读

网络字体反爬之pyspider爬取起点中文小说

作者: 星星在线 Python爱好者社区专栏作者简书地址:https://www.jianshu.com/u/680e0e38ddc9前几天跟同事聊到最近在看什么小说,想起之前看过一篇文章说的是网络十大水文,就想把起点上的小说信息爬一下,搞点可视化数据看看。这段时间正在看爬虫框架-pyspider,觉得这种网站用框架还是很方便的,所以今天就给大家带来...

发表了文章 • 2018-05-07 17:42 • 0 条评论

1
推荐
2169
阅读

Python数据分析与数据化运营:商品数据化运营7-本章小结

作者介绍:宋天龙(TonySong),资深大数据技术专家,历任软通动力集团大数据研究院数据总监、Webtrekk(德国最大的网站数据分析服务提供商)中国区技术和咨询负责人、国美在线大数据中心经理。本文来自《Python数据分析与数据化运营》配套书籍第6章节内容,机械工业出版社华章授权发布,未经允许,禁止转载!此书包含 5...

发表了文章 • 2018-04-26 16:22 • 0 条评论

0
推荐
2879
阅读

Python数据分析与数据化运营:商品数据化运营6-案例:基于LogisticRegression、RandomForest、Bagging概率投票组合模型的异常检测

作者介绍:宋天龙(TonySong),资深大数据技术专家,历任软通动力集团大数据研究院数据总监、Webtrekk(德国最大的网站数据分析服务提供商)中国区技术和咨询负责人、国美在线大数据中心经理。本文来自《Python数据分析与数据化运营》配套书籍第6章节内容,机械工业出版社华章授权发布,未经允许,禁止转载!此书包含 5...

发表了文章 • 2018-04-26 16:19 • 0 条评论

0
推荐
4727
阅读

Python数据分析与数据化运营:商品数据化运营5-案例:基于超参数优化的Gradient Boosting的销售预测

作者介绍:宋天龙(TonySong),资深大数据技术专家,历任软通动力集团大数据研究院数据总监、Webtrekk(德国最大的网站数据分析服务提供商)中国区技术和咨询负责人、国美在线大数据中心经理。本文来自《Python数据分析与数据化运营》配套书籍第6章节内容,机械工业出版社华章授权发布,未经允许,禁止转载!此书包含 5...

发表了文章 • 2018-04-26 15:57 • 0 条评论

1
推荐
1835
阅读

Python数据分析与数据化运营:商品数据化运营4-“大实话”

作者介绍:宋天龙(TonySong),资深大数据技术专家,历任软通动力集团大数据研究院数据总监、Webtrekk(德国最大的网站数据分析服务提供商)中国区技术和咨询负责人、国美在线大数据中心经理。本文来自《Python数据分析与数据化运营》配套书籍第6章节内容,机械工业出版社华章授权发布,未经允许,禁止转载!此书包含 5...

发表了文章 • 2018-04-26 15:33 • 0 条评论

0
推荐
2266
阅读

Python数据分析与数据化运营:商品数据化运营3-分析小技巧

作者介绍:宋天龙(TonySong),资深大数据技术专家,历任软通动力集团大数据研究院数据总监、Webtrekk(德国最大的网站数据分析服务提供商)中国区技术和咨询负责人、国美在线大数据中心经理。本文来自《Python数据分析与数据化运营》配套书籍第6章节内容,机械工业出版社华章授权发布,未经允许,禁止转载!此书包含 5...

发表了文章 • 2018-04-26 15:20 • 0 条评论