95后数据科学家教你从零自学机器学习,这有3本入门必看书籍

浏览: 1102

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。

来源 | 量子位(id:QbitAI)

发自 | 凹非寺

厌倦了现在的工作,想转行做数据科学,但是却没有计算机专业的相关学历,应该怎样才能入门?

这类的教程已经有很多。最近一位22岁的数据科学家Dario,以自学经历中用到的资源告诉你,如何从零开始学习数据科学。

所谓从零开始自学,是针对那些可以自主学习在线课程和阅读书籍,却没有上班之余接受课堂教育的人士。

在学习之前,如果你对线性代数、微积分、概率论与统计学、程序设计都不太熟悉,Dario建议先去学习一下这几门数学课程,然后再学习Python。

在学完以上内容后可以进入下面的学习。

01看书还是看视频

如果想进入数据科学领域,每天一两个小时的学习是必不可少的,是看书还是选择看视频?

很多人都不想在每天工作8小时后还看书,因此视频教程是个不错的选择,而且可以在通勤路上观看。

Dario首先推荐的是Udemy的《数据科学与机器学习Python训练营》,这是他第一次接触数据科学的时候学习的课程。

课程中用Pandas和Numpy进行数据分析,并用Matplotlib和Seaborn进行一些数据可视化。虽然内容不多也不深入,但已经足够入门数据科学了。

Dario还推荐了Coursera上由吴恩达主讲的《机器学习》课程,学习时长大概十多个星期。课程以英文讲述,但是提供中文字幕。

这门课程的质量绝对有保障,大约12万名用户平均评分为4.9(满分5),人气也超高,共有260多万用户注册。

02三本优秀的入门必看书

如果你更喜欢读书,Dario还推荐了3本入门数据科学的优秀教材。

第一本是《Python数据科学手册》,这本书从Jupyter Notebook入手,内容涵盖了Numpy、Pandas,、Matplotlib和Scikit-Learn等数据科学中最重要的部分。

该书的中文版去年已经出版,网上评分9.3,网友都说这是本优秀的入门级教材,非常适合非计算机专业的学生。

第二本是《统计学习导论》,它的内容会有点数学,但是也很容易阅读。

对于机器学习这样一个广泛的领域,这本书能将篇幅控制在400页左右很不容易。唯一的缺点是代码是用 R语言而不是Python编写的。

这本书的英文版提供免费下载(地址见文末),评分为9.5分,中文版8.3分。

第三本是《Scikit-Learn与TensorFlow机器学习实用指南》,这本书能帮助你深入了解机器学习的概念和算法。目前,该书的英文影印版和中文版都已经出版。

03下一步

学完所有课程后,Dario建议初学者建立一个GitHub存档,并寻找5个数据集来练手,在这个过程中写出自己的结论和思考过程。

对于你未来要投递的公司来说,让他们看到你的工作很重要。因为你没有相关学位,因此需要以某种方式展示自己在数据科学中的工作,而GitHub是一个不错的选择。

数智物语征稿启事.png

星标我,每天多一点智慧

推荐 0
本文由 数智物语 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册