【大咖说】数据挖据工具,到底哪家强?

浏览: 1507

菜鸟数据岛的岛民们!


又见周末,又约大咖。

菜鸟如你,会不会困惑:数据分析、数据挖掘工具辣么多,我们到底应该先学哪一个?

今天我们请来偏重工业数据挖掘和金融数据挖掘的卓大师来给大家指点迷津。还不拿出小本本做笔记。

Clipboard Image.png

卓金武,MathWorks中国科学计算业务总监,主要负责数据挖掘、优化、量化投资、风险管理等科学计算业务,已为工行、交行、中投、华为、通用、一汽、上汽、格力等多家企业提供数据挖掘解决方案。著作三部:《MATLAB在数学建模中的应用》(第一版和第二版),《量化投资:数据挖掘技术与实践(MATLAB版)》,《大数据挖掘:系统方法与实例分析》。

R语言,SAS,SPSS,Matlab,这些热门的技术,哪一个更适合初学者使用的?

其实这四个工具上手都比较容易,这个时候就要考虑学习者偏向科研、应用还是开发。SPSS这几年影响力变弱了,相比之下R,SAS和Matlab发展比较好,用户影响力越来越大,所以尽量在这三个里面选择。

如果是在小公司工作,比较适合学习R,开源的,免费的,而且上手比较容易。如果是在大公司,适合SAS。偏向研发的可以多考虑Matlab。Matlab是一个综合性的工具,不仅可以做数据分析,还可以做优化,覆盖面广外延性好,所以对不知道未来从业方向的初学者适合学习Matlab。SAS是收费的商业软件,上手也比较容易,适合界面操作,对编程要求不高,如果只是按流程做常规数据分析和挖掘适合用SAS。

菜鸟应该如何开展数据挖掘的学习呢?

学习数据挖掘的核心是培养数据思维。所谓的数据思维就是拿到数据之后把握数据价值,这中间有很多技术细节和流程。最基础的一定要掌握牢,就像数据挖掘的基本过程:确定商业目标-收集数据-数据预处理-根据算法建立模型-验证模型-部署运用。要知道每一步怎么去做。

作为菜鸟来说,首先看一本靠谱教材还是很重要,一开始很多看不懂没关系,主要目的是培养思维,看看别人项目怎么从规划到实施,搞清楚流程,掌握好框架,然后再针对性的通过学习和实践来完善知识架构。

Clipboard Image.png

您的大客户涉及通信、金融、互联网各个领域,在分析中应该如何下手?

众多项目案例虽然行业不同,背景不同,但是处理方法都是相通的。我们做数据挖掘,看到就是一堆数据,只是说数据反映内容不同,但研究方法、处理思路都一样。从事数据分析、数据挖掘的人来说,遇到新项目要先了解行业背景、行业知识,知道数据背后的含义就可以用相同的方法去处理了。

你能预测下数据分析以后的发展方向吗?

数据分析、数据挖掘和机器学习慢慢就会变成通用技术了,不光是职业的数据分析人员,专业领域人士有数据后也会用比较成熟的数据挖掘的工具和方法去分析。就像Matlab的机器学习,看着很高大上,但实际上已经开发出App,让机器学习非常容易实现,不太了解的人也可以迅速上手,拿来分析数据。

未来数据分析方向竞争会很激烈,所以专业的数据分析人员要更多转向咨询方向,因为数据挖掘的思维需要行业历练,专业的数据分析人员要在这里开拓优势。


Clipboard Image.png

推荐 1
本文由 菜鸟数据岛 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册