我的第一次R会

浏览: 1216

作者黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。

邮箱:huang.tian-yuan@qq.com

精彩回顾:

无缝对接Spark与R:Sparklyr系列—探讨属于数据科学家的Spark

R语言二分类问题案例分析:以泰坦尼克号沉船为例

R与Python手牵手:特征工程(数值型变换)

前言

这是本公众号原创作者第一次参加R会的过程和感受,分享给各位小伙伴们。

刚在华东师范大学参加了第十一届中国R会议上海分会,受益匪浅。华师大是我的母校,从食堂的菜品,道旁的园艺,体院的气派,书馆的设施,处处都散发着人文关怀的气息。返校参会的我倍感亲切,仿佛回家一般。

  华东师范大学图书馆剪影  

说来惭愧,华师大办R会已经有很长的历史,但这却是我第一次参加R会。以前我总是一个人买书学习,遇到问题就上网查询,但是很少与社区互动,这其实是一个缺憾。这次参加R会,能够听到各位老师以及业界先锋从业者的讲座,真的是学到很多东西。 

第一天

大会的第一个演讲者是张丹老师,张丹老师就目前大环境谈了R的地位以及在业界的应用,我深以为然。业界很多人拿R与Python做比较,甚至危言耸听,说R将被Python完全取代。但是讲座后在与老师的交流中,张丹老师给我打了一剂强心剂。R语言一直在科研界和工业界都具有不可取代的地位,它在探索性数据分析上具有非常强大的优势。我认为,R语言在将来也许会更多地走向探索性数据分析的上游,也就是最新统计方法和算法的实现,但是也不乏在下游的精湛之作。至少在金融商业领域,R语言的应用是广泛而深远的。

 

第二天

第二天的分会场中,我参加了与应用相关的分会场。其实我在浏览就业招聘信息的时候一直有留心,想知道R语言在工业界都有哪些应用场景。我自己来说,其实主要是把R语言运用到自己的科研工作中。我的数据从采集、预处理、清洗到可视化、统计建模、报告展示全部都是用R语言完成的,它简直就是我一站式的百宝箱,满足了我所有的需求。但是在工作岗位爬虫分析中,发现目前很多公司对R语言的企业级应用并不多(也可能是我个人圈子太窄),常有隐忧。但是这次参加了R语言应用的分论坛,我认为R语言在企业级应用中还是有非常大的潜力的。一个最有力的证据就是,SAP的数据架构师金江老师,给我们介绍了R语言如何无缝对接企业级的数据管理系统。我以前探索过R语言与Spark的对接,认为大有可为。没想到还有很多其他大的企业级系统提供了R语言的接口,而且发展极其迅速。此外,上午台北R-Ladies的运营人詹欣谕也介绍了如何利用shiny来做Web应用程序,这个应用可以得到微软Azure云平台的支持。 

这次大会还有幸见到谢佳标老师,听他分享在使用Rmarkdown的经验,还介绍了谢益辉老师最新的工作,将会给我们带来更多便捷的工具和更加优秀的教程。此外,张杰老师也分享了他在数据可视化中的探索,看到他做的地铁与房价耦合分析的项目,感觉非常有意思,如果以后有条件真想结合这些工具和话题做一些有意思的东西。不听不知道,一听吓一跳,制药业的从业者姚树亮在利用R语言爬虫时也颇有心得,让人耳目一新。我自己也用过R语言做过一些爬虫的工作,但是很多问题都没有得到解决,这次终于遇到了知音,在会后与他交流并留了微信。R会真是个好地方,能够认识很多业界的大佬,促进更多的交流合作。

与张丹老师的合影

感受

学习R已经有五年的时间了,其实自己也有过迷茫的时候。有时候觉得究竟要学到什么程度才算可以呢?立志做一个全栈数据科学家,但是越学就越感觉R知识之海浩瀚无边,我也只能结合自己的需要,立足于实际的应用场景,不断拓展自己的知识储备和技术经验。张丹老师给我们指出了一个很好的方向。他的著作《R的极客理想》,是我所知道的唯一一本能够从中文翻译成英文推广到国外的R语言图书。我认为这是一个里程碑,是中国R语言在应用方面走向成熟的标志。我们通过阅读大量的中英文资料,学到了先进的R语言知识。我们通过在各行各业使用R的实践经验,经过分享,让各个R用户能够更好地完成手头的任务。R的开源思想,本身就鼓励大家分享代码,提高代码的可重用性,推崇让用户通过分享代码和实践经验,从而达到更大的进步。张老师积极地分享他在业界的经验,让大家在他的基础上(巨人肩膀上)继续探索自己的工作,这就是最原始而纯粹的R的开源精神。在未来,我也希望能够不断积累自己的学习和实践经验,然后通过我的代码和我的文字,分享给R的用户,让R社区更加活跃。希望中国的R语言中文社区,能够得到蓬勃的发展!

写在最后

看了文章,你是不是更加热爱R语言了!最后小编想说不管你能力如何,有这份热爱就已足够!未来,小编会继续为大家推送更优质更棒的R语言文章!

公众号后台回复关键字即可学习

回复 爬虫             爬虫三大案例实战  
回复 Python        1小时破冰入门

回复 数据挖掘      R语言入门及数据挖掘
回复 人工智能      三个月入门人工智能
回复 数据分析师   数据分析师成长之路 
回复 机器学习      机器学习的商业应用
回复 数据科学      数据科学实战
回复 常用算法      常用数据挖掘算法

推荐 1
本文由 R语言中文社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册