吉林说R系列——第四篇:如何学习R语言

浏览: 1191

本文作者:王吉林

现在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程,这就导致很多人不知道如何着手学习R语言。有幸的是,作者在暨南大学统计学系攻读研究生期间,王斌会教授开设了R语言相关课程,对R语言有了初步的认识,后来临近毕业,加入了人大经济论坛做版主,倒逼着自己钻研了一阵子。现在梳理一下R语言学习的经验和大家分享,不妥之处还请各位大侠批评指正。

对于初学R语言的人,往往是迷茫的:一是没有摆正心态,觉得自己没有编程的能力,看到代码就头晕,我就想反问一句,北方人初到广东不喜欢吃叉烧包,为什么最后能爱上叉烧包呢,番茄炒蛋北方都是咸的,最后你为什么习惯了吃甜的呢?二是书籍选择困难症,到底是英文原版还是中文翻译版呢,我又想反问一句你的英语水平够了吗,你的阅读效率如何,你理解文化差异吗,如果你一个月只能读两页,每页都要去查有道词典,选择英文版,你还是歇菜吧。三是遇到困难不知道如何选择帮助,多用?+函数名的方式获取帮助,习惯去人大经济论坛、统计之都、R语言中文社区等论坛搜索帮助,习惯用Google、百度浏览器搜索帮助,习惯去关注我,哈哈哈。四是舍不得花钱,在电脑上看pdf版的电子文档,不愿意看纸质的书,就作者的经验来看,一方面你的视力会急速下降,颈椎、肩膀会疲劳,你的健康受到影响,另一方面效率值得商榷,你可能会去浏览网页,看视频,聊天去了,网络世界的诱惑是巨大的。另外没有纸和笔,关掉屏幕你还能记得多少呢?就个人感觉,看书,涂涂画画会记忆深刻一些。五是缺乏耐心恒心,好高骛远。初学R的人一开始都有崇高的理想,希望一步登天,什么都能解决,什么书都要看完,最后最简单的都没有学会。知识终归回到实践中,当你有真真切切的需求的时候,先制定一个小小的目标,比如先学习数据的读写。任何图形和模型都是从数据开始的,真正了解数据的结构和属性并没有看起来的那么简单,能够熟练的掌握数据的各类操作,犹如大楼打好了地基,一层层盖起来的速度就会惊人。反之今天学习计量经济、明天时间序列、后天多元统计等等,最后就是什么方法都一知半解,甚至会用错。六是缺乏回顾温习的习惯。学习一种方法或者解决一个问题后,能够及时进行总结,并能够找一个具体的案例演示一遍或能够联系到实际的应用场景,可以很好的巩固掌握和理解程度,也会开阔思维,打破为了学习而学习,无法应用或者不会应用的困境。

对于初学R语言的人,往往可以按照以下几个方面进行学习:

一是选好书籍,循序渐进。R语言中文书籍现时已经非常多了, R语言入门书籍的内容大部分都是相通的或者部分章节都内容是一样的。众多书籍中,一个新手应该怎样选择呢?首先,可以选择《R导论》中文版[1],这是一本关于R 环境入门的教材,同时也是R 官方文档中面向大众用户的教材,阅读这本书无需耗费太多的经历,可以向看小说一样进行浏览,记得大概的框架和相应的函数就好了,这本书没有太多的实例介绍。其次,可以选择作者读研期间的教材《统计建模与R软件》[2]这本书,后来在广东女子学院代课时,笔者也选用了这本书做教本。这本书内容比较详细,从软件安装到深层次的统计分析方法都有涉及。因此,学习本书需要一定的统计学基础,但是不用怕,因为本书本来就可以作为一个统计学的教科书,在书中相关知识都会做简单介绍,如果只侧重应用,就应该可以满足了,如果有兴趣深究,可以参看卯诗松的《概率论与数理统计》,还有人大几位老师的统计学及多元统计相关书籍。学习完两本书之后,恭喜你,你可能已经打败了80%(纯猜测,不负法律责任)的R语言学习者,当然这里的学完是真正意义上的学完,而不是走马观花,一知半解。最后,你需要学习一些带应用功能的书籍,知识若不落到实处,那前期的学习就是浪费生命啊,是多么不负责任的表现。《ggplot2:数据分析与图形艺术[3]》中文版,是一本神一样的R绘图说明书,学好这本书,你可以随心所欲画图了,满足日常工作需求绰绰有余。《时间序列分析及应用:R语言[4]》这本书难度较高,需要有一定的抽象能力,如果是在金融领域工作的可以结合《金融分析导论:基于R语言[5]》一起来学习,因为后者有更多的应用案例。数据挖掘方面可以参考《数据挖掘:R语言实战[6]》、《数据挖掘与R语言[7]》这两本书,当然从网上搜索一些正则表达式之类的内容,结合起来一起学习,就更棒了。《机器学习:实用案例解析[8]》,这本书由浅入深介绍了机器学习的各种方法,对实际应用能力的提高有一定的帮助。至此,恭喜你,你已经超过我了,哈哈哈。也许你有些惊讶,哇,原来R能做这么多事情,浪费那么多年时间读书真是不应该,千万不要这么想,因为你的综合素质、经验及修养都是需要磨砺才能像今天这样优秀的。又给你喝了碗鸡汤,是不是应该给我打赏,哈哈哈。

二是制定计划,贵在坚持。首先,要有计划性,不能欺骗自己。小时候父亲经常告诫我说,学习来不得半点马虎。现在这句话有很多流行的版本了,比如生活就像一面镜子,你怎么做,它就怎么反馈等等。制定计划是非常重要的,一本书,看看目录,知道大概内容和页数,从不同的维度去拆散它,合理分配时间各个击破。每完成一项内容,最好写一下笔记,加深印象,哪怕你总结一下发个朋友圈mark一下,也会在一定程度上对记忆有所帮助。其次,要咬牙坚持,古人云,不积跬步无以至千里,除非有特殊情况,不要长时间中断,大事小事天下事,事事关心,在学习R语言的路上就不是很可取了。

三是注重实践,写一写。好记性不如烂笔头,没有实际操作过的事情,那都是理论。就像没有谈过恋爱的人,天天指导别人,真正自己谈恋爱的时候就歇菜了,非常不可取。R语言是一种编程语言,对代码的要有一定的敏感性,即使你从别人书上看到的代码和结果是正常的,轮到你写就不一定了,可能代码少了一个字母,没有区分大写小,环境变量未设置,或者是路径没有加等等,千奇百怪的事情都会发生。很容易产生眼高手低的情境。下载安装一个Rstudio,当你写函数的时候,他会有提示选择功能,在里面写程序可以减少类似错误的发生,提高效率。结合平时的思维逻辑,可以天马行空,想想一幅柱状图,是不是可以不用颜色填充,可以改成花瓣,男女等等类似的填充。改变一下默认的参数,看看有什么效果,当然不一定有好看的呈现,但是你会知道,这个参数它的实际意义是什么,比你强记100遍还要来的直观。

四是站在巨人的肩膀上,你可以飞起来。R语言大牛人是非常多的,但很多已经趋于商业化,看到很多专业机构的培训费用高达3000多,吓死宝宝了,300我都嫌贵,来200我给你培训一下有木有,开个玩笑。当然历史留存下来的宝贵经验和心得完全够你把基础打好。没事不要瞎逼逼,多去R语言中文社区逛一逛,翻翻历史记录,相信每一篇文章不能说是精华,但总有你可以吸收的养分。我相信,如果你能把中文社区每一篇文章吃透,你已经非常了不起了,因为我确定没有一个作者敢说他是全能的,而你是,想想是多么厉害,这就是积累,届时你完全可以独立飞行了。

最后,利用词云恶搞一下自己,看看轮廓还是有的,如果我的皮肤再黑一点,会是怎样呢,哈哈…,当做练习,大家尝试一下绘制一些有意思的图形,如有疑问,可以与我联系(微信:18566011370)!

Clipboard Image.png


[1]这是由丁国徽翻译的,由于涉及版权等事宜,本文提到的书籍暂不提供pdf文件,有需要的可以联系作者,微信:18566011370。

[2]这是薛毅编写的。

[3]这本书是由统计之都翻译的。

[4]这本书是由潘红宇翻译的。

[5]这本书是由李洪成等人翻译的。

[6]这本书是由黄文等人编写的。

[7]这本书是由李洪成等人翻译的。

[8]这本书是由陈开江等人翻译的。

895+5+5+5+9.png

推荐 2
本文由 R语言中文社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册