本章节主要讲述R语言的基础及如何与MySQL进行关联操作,以及如何利用R在网上去爬数据,是个人比较喜欢的内容不知道有没有和我一样的小盆友。
细细道来~
【R语言常用基础函数】
1.查看表格维度dim()
2.设置数据框的行名子rownames(某一个行名)=名字
3.查找R里面的所有对象is()
4.随机写出1~10的5个数据sample(1:10,5)
5.读入文本文件,注意文件路径是双斜杠 文件名<-readLines(文件路径)
把工作台路径进行修改
6.三种查看数据类型的方式区别
modo<class<typeof的细分情况
7.seq(限制首项目,限制为项目)创建等差数列的函数,自动默认匹配步长为1
8.重复系列的创建rep
9.将数据写入电脑write.csv(iris,"iris")
【第一章作业】开始是先看到标题的,直接在进行R的操作然后回过头对照课程的方式对照学习的,所以整理了自己与老师讲的代码对比,不同的方式可实现相同的效果。
【R链接MySQL数据库】
&链接MySQL数据库的时候需要进行配置文件&
1.搜索出电脑的ODBC,找到自己电脑符合的,我的电脑是“设置ODBC数据源64位”
2.点击添加,找到mySQL内容添加后进行配置
3.名字自己命名就好
点击Test查看是否配置成功
【注意】在R中加载RODBC包,mysql和odbc配置的版本与R使用的位数版本要一致。
【爬取网络数据】
通过DT::datatable()将表显示交互界面表格方便看数据
通过不同的包和函数可以在网站上进行爬取数据,我是第一次进行网上数据的爬取,不知道是不是算是踩的坑,在爬数据的时候,遇到了一个小插曲,目前最熟悉的一种方式是用readLines的方式进行爬取,用rvest方式一次没有成功过(比较郁闷,继续练~)。最开始是以为看不懂网上源码的结构找筛选字段找错了,后来是发现报错的是网站链接不上报错202和203(不知道什么原因,有没有大神能解释一下呢),还有一些让我现在这水平的选手处理不了是就是想要的字段内容在一行,估计可以爬出来就是费点劲。
自己小试牛刀一下,用readLines的方法爬了爱卡汽车新车优惠的数据作为本章的学习验收成果和大家分享代码如下:
用DT::datatable()显示结果
如果不用DT,直接在RStudio里面点击直接查看也可