正如数据可视化在数据科学中有着重要的地位一样,用可视化的方式来展现数据领域的学习路线再合适不过了。这张图就是 IBM 公司的 Swami Chandrasekaran 在 2013 年受到地铁路线图的启发而创作的一份“如何成为一名数据科学家”的学习路径图,至今依旧是很有指导意义的一份学习参考,算得上是数据科学领域的一张经久不衰的“网红”图了。
这张图按照进度分为以下几部分:
基础
统计学
编程
机器学习
文本挖掘/自然语言处理
数据可视化
大数据
数据提取
数据转换
工具箱
每一个领域以一条地铁路线的方式呈现,需要学习/掌握/理解的那些概念或技能就是那些地铁站点。这张图的使用方式就是你选择一条线路,上车,然后经过这条线路的所有站点(要学习的概念或技能),直到终点站或者你换乘上了另一条线路,作者也给十条线路标记上了数字,作为一个建议的学习顺序。
你可以把这个作为一份独立的学习计划去挖掘你最感兴趣的领域,掌握相应的技能。当然,要成为一名真正的 Data Scientist,确实有很多硬技能需要去掌握,但是更可贵的是对数据的理解、敏感和洞察力。哪怕掌握了图中全部的技能,也只是你数据之旅的开始,绝不是终点。