虽然我是统计学专业的,大学时也学过一点SAS,但是对SAS一直存在“偏见”,认为其又丑又难学,不过当时是8.x的版本,界面确实很丑。
因为工作原因,半年前开始学习并使用SAS了,这个被国内统计学学生嫌弃的统计学专业软件。先看了《SAS编程与数据挖掘商业案例》这本红皮书,看的晕乎乎的,看了两三遍吧!依然没有适应SAS的语法和习惯,当时的感觉是:SAS很怪异,与我熟悉的VBA和R都完全不同,一定要理解代码的运行机制,比如PDV,网上下载了一下SAS考题,结果也就能得60~70分吧!真正能完全理解,说出为什么对为什么错的估计不到一半,所以学习SAS一定要深刻理解PDV,并且要多尝试,举一反三!
后来又买了本《深入解析SAS 数据处理、分析优化与商业应用》这本白皮书,很厚的一本书,SAS官方推荐的,在这里我也极力推荐一下,因为这本书写的非常适合小白看,结构清晰,易懂,而且涉及统计学的几章中对统计学理论的讲解也非常易懂(这点非常赞),再读这本书,感觉轻松多了,毕竟有了第一本书的基础,但是只看书,跟着示例练习是不行的,一到应用就懵了。
现在说一下实战感悟吧~虽然看了两本书,看了一个月,但是到真正做需求的时候就发现:完全不是一回事儿!!完全不知道从哪儿下手,现在来看,其实用的最多的就是merge、proc sort、proc sql等,说白了就是数据集间的匹配(类似于Excel中的vlookup)和sql关联,目前感觉用的最多的就是这些了,毕竟我也是刚入门,刚用了半年SAS~
说一下SAS的优点吧~感觉SAS的处理效率还是很高效的,而且能处理大数据,上亿条的数据处理起来也没有任何问题;SAS是统计学专业软件,在做统计分析时确实很专业,能够输出许多指标及检验,且能得到国际认可,目前的9.x版本界面也好看了许多;还有一个就是金融企业都用SAS,当然现在应该也会辅助使用R、Python之类的吧!SAS的缺点也很明显:贵!!!这个让大家都敬而远之了,大家更喜欢开源的R或Python,而且使用简单,图形漂亮,学习起来上手快,成本低。
目前很热的随机森林、SVM、KNN、神经网络、决策时之类的算法在SAS中好像很难实现(似乎是有,但我没有在我们公司安装的SAS模块中找到),即使这些在SAS中能实现,我觉得也不会比R或Python更方便。
还请SAS大神多指正,赐教一下SAS的学习方法及资源,谢谢~