0
推荐
1566
阅读

干货 | Scikit-learn 和 Pandas 速查表

之前与大家分享过 28 份经典的速查表,内容涵盖机器学习、数据科学、概率论、SQL 以及大数据工具(文末有传送门),今天为大家补充两份 Python 速查表。 1 PandasPandas 是 python 的一个数据分析库,最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的...

发表了文章 • 2017-03-28 11:58 • 0 条评论

0
推荐
1761
阅读

Titanic 幸存者预测分析案例(1)

上一期为大家介绍了 Kaggle 的经典入门案例——泰坦尼克号(Titanic)幸存者预测,今天就为大家带来一个参考的解决方案,是 Kaggle 参赛者 Omar El Gabry 分享的 Kernel(得到 426 票支持,是该项目票数第二高的 Kernel),展现了一个大致的机器学习处理流程:如何处理缺失值、观察数据分布、挑选特征等等。代码...

发表了文章 • 2017-03-28 11:30 • 0 条评论

1
推荐
1160
阅读

人工智能创业者需要知道的事

你有多少数据?可以获取多少数据?                                    图片来源: http://wersm.com/wp-content/uploads/2015/08/wersm-how-much-data-is-generated-every-minute-infographic.jpg不要和 Google 竞争...

发表了文章 • 2017-03-23 14:23 • 0 条评论

0
推荐
2405
阅读

浅谈人工智能、机器学习、深度学习和物联网

我们都很熟悉“人工智能”这个词。它曾经在很多电影比如《终结者》、《黑客帝国》、《机械姬》等里面出现过。但是近几年你在有些地方看到的用词可能不是“人工智能”,而是“机器学习”或者“深度学习”。那么,人工智能、机器学习和深度学习的区别是什么?                  &nbs...

发表了文章 • 2017-03-16 10:49 • 0 条评论

0
推荐
1096
阅读

如何用简单易懂的例子解释隐马尔可夫模型?

隐马尔可夫(HMM)好讲,简单易懂不好讲,我想说个更通俗易懂的例子。我希望我的读者不是专家,而是对这个问题感兴趣的入门者,所以我会多阐述数学思想,少写公式。霍金曾经说过,你多写一个公式,就会少一半的读者。所以时间简史这本关于物理的书和麦当娜关于性的书卖的一样好。我会效仿这一做法,写最通俗易懂的答案。...

发表了文章 • 2017-03-14 10:57 • 0 条评论

2
推荐
1212
阅读

机器学习鉴定《鬼吹灯 1-4 》是不是天下霸唱所写

 1 引子鬼吹灯是一本我很喜欢的网络小说,它帮助我度过无数个空虚寂寞孤独冷的夜晚。不但文字看了一遍,后来被青雪故事出了有声书以后我还听了一遍。按照作者描述,鬼吹灯一共出了8本,写作时间是06年2月到08年2月。虽然我们都知道一个系列开头精彩、后面烂尾的可能性是极大的,可鬼吹灯前四部跟后四部的差距...

发表了文章 • 2017-03-13 10:59 • 2 条评论

2
推荐
1395
阅读

20 份古怪的机器学习数据集

有人说,机器学习 95% 的问题在于数据。如今开放数据越来越多,几乎在任何领域里都有开源分享的数据集。但是要找到有趣的数据集还是有些难度的,为了深入了解,我广泛搜索了诸多资料,并且把我发现的一些数据集进行的小小的整理并作分享。想到可能有些人会需要用到,所以这里整理了 20 份出色但又古怪的数据集,你...

发表了文章 • 2017-03-11 22:30 • 1 条评论

1
推荐
1083
阅读

数据科学领域的一张网红图

正如数据可视化在数据科学中有着重要的地位一样,用可视化的方式来展现数据领域的学习路线再合适不过了。这张图就是 IBM 公司的 Swami Chandrasekaran 在 2013 年受到地铁路线图的启发而创作的一份“如何成为一名数据科学家”的学习路径图,至今依旧是很有指导意义的一份学习参考,算得上是数据科学领域的一张经...

发表了文章 • 2017-03-09 09:10 • 0 条评论

2
推荐
4213
阅读

干货 | 28张相见恨晚的速查表(Cheat Sheet)——R语言篇

数据科学是一个日益增长的领域,随之而来的也有数不清的工具和技术。如果要去记住每个概念的所有的函数、操作步骤和公式几乎是不可能的,这就是速查表(Cheat Sheet)会出现的原因。依照”清晰明了,内容充足”的标准,为大家挑选整理了 28 份速查表,内容涵盖机器学习、数据科学、概率论、SQL 以及大数据处理技术,相信对...

发表了文章 • 2017-03-08 15:04 • 1 条评论

3
推荐
2339
阅读

干货 | 28张相见恨晚的速查表(Cheat Sheet)——Python篇

依照”清晰明了,内容充足”的标准,为大家挑选整理了 28 份速查表,内容涵盖机器学习、数据科学、概率论、SQL 以及大数据处理技术,相信对你一定有帮助。今天带来的是数据科学中的 Python 应用速查表。                               ...

发表了文章 • 2017-03-08 14:55 • 1 条评论

1
推荐
1313
阅读

干货 | 28张相见恨晚的速查表(Cheat Sheet)

依照”清晰明了,内容充足”的标准,这里为大家挑选整理了 28 份速查表,内容涵盖机器学习、数据科学、概率论、SQL 以及大数据处理技术,相信对你一定有帮助。                         这是一些经常会用到的机器学习算法的 Python 和 R 代码,这些算法...

发表了文章 • 2017-03-08 14:45 • 0 条评论

0
推荐
1270
阅读

浅谈机器学习开发流程

导读:相比于传统软件开发流程,机器学习开发更像是一个富有创造性的研究过程。设计产品、编程实现、测试、修复漏洞、发布产品...... 敏捷开发在软件开发世界中无处不在。然而,机器学习开发更像是一个富有创造性的研究过程。当然,这之间有很多相似之处,这里会简单罗列一下。对于那些还没有自己亲手做过一个端对...

发表了文章 • 2017-03-08 11:04 • 0 条评论