新鲜感仍在,激情犹存,望一如既往;
对于数据人来说,我们的诗和远方是什么?是在大数据时代背景下尽情滴施展拳脚。对于企业来说,诗和远方是深度挖掘数据价值,支持业务的持续优化;实现以数据驱动业务的商业模式。无论个人还是企业,诗和远方都还没有真正来临,大多数集中在概念阶段,或者是探索阶段。因为我们正在经历苟且。(试问有多少数据公司在盈利?或者盈利公司的业务是否以数据驱动为前提?)
那么苟且是什么?个人认为,对于企业是数据存储与管理(数据结构,数据合规性等等)。对于个人是分析挖掘技术的积累与延展(理论+工具)。关于理论与工具,网上的东西一抓一大把。接下来就是选择的问题了。
对于理论:我相信所有的数据人或准数据人都有一定的理论积淀,所以建议以操作软件带动理论的学习,软件学习的书籍,都会有理论铺垫,而对于理论来说,一般情况下没有必要完完全全地明白,只需要懂得理论机理,一般用在什么场景,理论的优缺点是什么就可以了,具体执行可以交给软件。
对于软件:R语言是开源的,互联网企业很多在用,还有一些通迅行业的咨询公司,不过上手还是需要长期的学习;SPSS界面友好型,一般是市场研究用的比较多,如果用SPSS编程其实功能还是比较强大的,建议如果想先练手可以学这个,上手快;SAS一般是金融企业,特别是银行业和医学统计,银行业人员有一些是用SAS做统计,一般是银行业内部人做的,另一种是给银行业做数据挖掘的公司,不过正版一年也要上百万,而且SAS学习没人指导很难学;所以看小伙伴的选择,想在传统或者咨询公司做的SPSS比较合适,想去金融特别是银行业SAS不错,想进互联网公司学R语言可能是比较明智。对于学什么软件,自己衡量就好了,为什么没有说Python呢,因为我没有接触过。