新手教程:如何学习R语言

浏览: 2236

其实相对于常见的编程语言,R语言还是非常容易上手,并不需要很多年的编程经验。而且可以在数据分析领域大展身手。

前言

我当初学习R的时候在网上搜到一则流传很广的R语言学习路线图(R语言学习由浅入深路线图),我在微信圈,微信公众平台上也见多次,写的确实很详细。但是对一些没有编程经验的童鞋来说,学习的难度还是太大了。后来自己浏览了很多R语言书籍,尝试了一些门槛比较低的书籍。自此,R语言学习才走上正轨。以下涉及内容包括R语言书籍的推荐,以及R语言相关课程的推荐,学完这个教程的内容之后足以应付工作学习中遇到的统计分析的问题了。

经典书籍推荐

R语言有两类书籍比较“坑”,一类是Programming类,一般都带programing字眼,但不绝对。这类书籍一般是计算机背景的人写的,关注的重点是编程(鞋代码和编程不是一码事),底层的运行机制之类的,比较难以捉摸,典型的例子是《The art of R programming》。还有一类是讲统计知识比较多,而且喜欢推公式。虽然有所裨益,但是会分散很多学习R的精力,可以作为后期提高的书籍,但是作为入门不太合适,像《The R book》。

讲完了“不好的”R的学习资料,可以规避一些“误入歧途”的风险。下面介绍一下我觉得比价有用的学习资料。学习任何语言的捷径就是Learn by dirty。这里推荐一个网站,code school的Try R 课程,非常基础,从最基本的语句的赋值到最后的数据框的基本操作,手把手一步一步的教你,然后对你输入的语句,网页会给出判断,如果写错了,还有很详细的解释。网页全部是英文的,英语过了四级的童鞋应该可以应付了。

R的入门书籍,比较好的是Learning R , 中文名是《学习 R》。第一章到第五章的数据的基本入门,必须要细看的,而且要读好几遍的,这是R的最基本的东西,需熟练掌握,多家练习。别觉得看懂就行了,只有自己敲出来运行正确才行。第六章环境和函数这一章建议直接跳过,比较抽象,等回头R学的差不多了,再回头看比较好。大多数人,平时基本不涉及到这一样的内容。第七章 字符串和因子也是很重要的一章,特别是医学领域。第八、九章的循环,量力而行。第八章的内容其实大多数其他编程语言都会涉及。但是在R里面,这些显循环,用的较少。其实主要还是向量化的操作为主,也称隐循环。第九章的隐循环非常有用,是R最精华的东西,就是学习起来有点困难。其主要内容是 apply族函数,包括lapply, sapply, tapply, apply, mapply等。这本书最优秀的地方在于数据的subset部分,各种方法讲的非常详细,也有很多的例子。这也是R语言比较难入门的地方。

《R in Action》 确实一本非常优秀的书籍,我看喝多大神都推荐这么书,我大概学了一遍,确实非常不错。这本书非常好的地方在于围绕具体的问题展开,教你如何利用R进行操作,而且选取的例子也非常具有代表性,所以建议每个例子都要详细研究。但是这本书学习曲线比较陡峭,可能上一章的内容还没有消化,又要开始新的内容了。遇到问题时建议多点耐心,谷歌或者请教别人,把这些知识点掌握了,这是R的基础。

还有一本书,《R cookbook》,这本书是围绕具体的问题进行设置的。所以可以作为一个遇到困难时候的快速翻阅手册,里面特别有用的章节是如何运用apply组函数,上面两本书都讲得不是很详细。

R绘制统计图的功能非常强悍

Clipboard Image.png

你见过这么令人心神荡漾的图嘛!

你见过的没见过,想到的,没想到的,都可以绘制出来哦。哈哈,心动不如行动,几行代码一敲,令人心神荡漾的图片就出来啦。R绘图非常简单的,就是一个简单的学习记忆的过程。R语言绘图发展的非常快现在有三大绘图系统,基础绘图系统,Lattice绘图系统,ggplot2绘图系统。虽然各有其使用价值,但个人推荐ggplot2绘图系统以及基础绘图系统。 Lattice对于多分组的数据的展现比较好,但是ggplot2是可以很大程度上替代其功能,不学习也可以,非要用的时候依葫芦画瓢就可以了。

下面主要介绍R的基础绘图系统和ggplot2绘图系统的学习路线。R基础绘图系统《R in Action》中,花了很大的篇幅介绍了基础绘图系统,如果学习完了,工作中碰到的很多统计图就可以胜任了。如果你喜欢钻研,可以看看谢益辉(Knitr包的作者)的《现代统计图形》,讲的非常详细和透彻。不仅如此,更是讲解了图形的选择,图形的设计方面的知识。学有余力,不妨学习一下ggplot2绘图系统, 推荐《R graphics cookbook》一书。书中不仅有ggplot2的绘图代码而且还将其与基础绘图系统进行了比较。介绍的图形非常实用,而且ggplot2的扩展性非常强,可以发挥你的想象力,创造一些新奇的图形。

Clipboard Image.png

R语言书籍全家福

R语言学习网络课程推荐:

1. Datacamp,learn by coding类型的网站

课程设置非常用心,难度合适,内容丰富,最好的R语言学习网站之一。

Clipboard Image.png

2. 国内的视频课程

国内的R语言视频课程强烈推荐谢佳标老师的:数据分析与挖掘R语言十三式,打造R全栈专家

谢佳标老师介绍:

多届中国R语言大会演讲嘉宾;

目前为某游戏公司数据挖掘的负责人,带领团队对游戏数据进行深度挖掘,主要利用R语言进行*大数据的挖掘和可视化工作;

从事数据挖掘建模工作9年+,具有丰富的电商、电购、游戏、电力等行业经验,熟悉不同领域的数据特点,有丰富的利用R语言进行数据挖掘实战经验;

撰写《R语言与数据挖掘》、《R语言游戏数据分析》等书籍。

数据挖掘(R语言)从零开始,由浅入深,包括初级入门、中级进阶、高级提升和资深冲刺四个阶段,13套专业课程,从R语言基础、数据质量、数据可视化、数据挖掘、算法、机器学习等体系学习,介绍了R语言及数据分析与挖掘的各个技术细节。通过实际的案例演练,让学员真正体验数据挖掘与R的魅力。新手完全能够通过本课程学习,成长为优秀的R语言全栈专家。  

3. 强烈推荐Swirl包,你值得拥有。

Swirl包开发者毕业后就去了麦肯锡咨询公司了。

推荐 2
本文由 R语言中文社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册