Coursera系列-R Programming第二周

浏览: 2538

---

好久没发博客

且容我大吼一句

终于做完这周R Programming的作业了!

之前一直有报coursera的课程,但是总是没有坚持下去,这次收到他们的邮件推广,说data science系列课程开通了R语言的中文课程,有中文版论坛,有中文字幕,如此诚意满满,再不报名,就实在太落伍了。

为了让自己坚持,还花钱买了signature track,所以当这周五收到助教通知说,第一个编程作业周日就要截止啦,简直让我晴天霹雳

然后周六花了一天时间看视频,看GITHUB里一位大牛对这篇assignment的讲解,终于完成了三个函数的编写

总结一下经验

1)遍历文件夹,读取所有数据

files_list<-list.files(directory,full.names=TRUE) #遍历文件夹里的文件名,这里选择fullname,就可以读取工作目录下文件夹内的文件了
dat<-data.frame() #需要事先设定data.frame框架,否则下列rbind循环会报错
for (i in id){
dat
<-rbind(dat,read.csv(files_list[i])) #这里用rbind,把dat与新读取的文件联合。
}

2)循环与if嵌套时,要注意}的应用,否则程序会报错

    for (i in 1:332) { #这里有嵌套
语句
if (sum(complete)>threshold) #注意括号以及下列{}的引用
{语句1}
else {语句2}
}

然后对于WEEK2的课程,总结下来是:

1)尽量用有hard limit的for语句,而不是repeat或者while语句做循环,避免无限循环

2)循环语句嵌套2-3层即可,如果要多层嵌套,请先思考有无简易函数可用

3)R的全局环境,R包等,以及R为什么要把所有数据都读入内存(控制流)

4)R自编函数的主要目的是,省略重复劳作,对代码引用更加轻松

题外话

另外,在学习这门课之余,到MOOC逛,他们最近有一个叫做hour of code的活动,号召大家从小代码开始(放下IPHONE,开始编程)。

如果新生代从小开始就接触编程,那么十几年后,我们这些老人的优势在哪里呢?上海R语言会议上,有多个公司展示了他们用R做自动化报表的过程,这些原本需要人工多天的劳动,引入R后,均自动化了。那么如果所有的事情都自动化了后,拿着excel当饭吃,不思进取的所谓数据分析师,他们未来的出路又在哪里?

当编程语言逐步发展,当编程成为小学生必修课程,当excel可以做得事情,有R可以做得更好,不进步的人,就会被社会淘汰

believe tech, use tech, follow tech, can't stop

以此共勉。

 

---

推荐 0
本文由 尾巴AR 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册