数据小魔方

杜雨,EasyCharts团队成员,EasyCharts公众号及知乎专栏特约撰稿人。R语言中文社区专栏作者,微信公众号——“数据小魔方”创始人。兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。每天会为您推送Excel商务图表、R语言可视化及数据可视化精彩案例。 个人公众号:数据小魔方(微信ID:datamofang)

1
推荐
2087
阅读

R语言构建层次分析模型不看一下吗~

AHP (Analytic Hierarchy Process)层次分析法是美国运筹学家Saaty教授于二十世纪80年代提出的一种实用的多方案或多目标的决策方法。其主要特征是,它合理地将定性与定量的决策结合起来,按照思维、心理的规律把决策过程层次化、数量化。层次分析法的基本思路:先分解后综合首先将所要分析的问题层次化,根据问题的性质和...

发表了文章 • 2018-05-14 11:35 • 0 条评论

0
推荐
1936
阅读

ggplot2学习笔记之——ggplot2主题调整系统

ggplot2绘图系统拥有庞大、健全的图形美化系统,这一套图形美化依赖于图例调整系统、标度调整系统、标签调整系统、主题调整系统以及分面系统。本节仅从主题调整系统来浅析ggplot2是如何实现脱离数据层面的信息,单独实现主题调整系统的。从大的层面上来说,ggplot2的主题系统知识主要分为三个层面:一、主题调整函数:二...

发表了文章 • 2018-04-18 13:50 • 0 条评论

2
推荐
1754
阅读

ggplot2学习笔记——图例系统及其调整函数

最近确实更得太少了,也不知道自己在忙啥,反正感觉不到忙碌的收获,要不是好多小伙伴儿在后台催更,感觉都快忘了还有要更新这回事儿。进入2018年以来,1月份更新了3篇,2月份更新了4篇,三月份2篇,自己都感觉过分了哈哈~今天赶紧找空写一篇~学过ggplot2的小伙伴儿们大概都了解过,ggplot2的语法系统将数据层和美化层分...

发表了文章 • 2018-04-08 16:35 • 1 条评论

0
推荐
1746
阅读

一款脑洞大开的表格可视化神器

今天跟大家介绍一款任坤大神写的新包——formattable。这个包的功能很简单,但是却很具创意性,它颠覆了R语言data.frame数据表的呈现方式,允许在表格内自定义视觉化元素,比如对某一列数据进行字号、颜色、背景、以及图形化处理,整体的版式仍然保留表格的样式,但是已经具有了表和图结合的意味。关于数据框的呈现方式,R...

发表了文章 • 2018-03-22 17:23 • 0 条评论

2
推荐
1967
阅读

R语言学习笔记之——数据处理神器data.table

数据处理在数据分析流程中的地位相信大家都有目共睹,也是每一个数据从业者面临的最为繁重的工作任务。在实际应用场景下,虽然SQL(SQL类专业的etl语言)是数据处理的首选明星语言,性能佳、效率高、容易培养数据思维,但是SQL没法处理构建全流程的数据任务,之后仍然需要借助其他数据分析工具来对接更为深入的分析任务...

发表了文章 • 2018-03-05 10:52 • 0 条评论

5
推荐
2308
阅读

NoSQL学习笔记之——Redis基础

之前练习过一篇NoSQL之Mongodb基础的笔记,这一篇开始练习NoSQL系列的又一重要利器——Redis。Redis是一个开源的,基于内存并可持久化的日志型、Key-Value数据库,提供多种语言的API,是对传统关系型数据库的重要补充。Redis支持五种数据类型:string(字符串),hash(哈希),list(列表),set(集合)及zset(sorted se...

发表了文章 • 2018-03-01 13:36 • 0 条评论

0
推荐
1642
阅读

R语言学习笔记——R语言面向对象编程系列2

最近在看任坤大神的新作——《R语言编程指南》,其中对于编程语言中非常流行的面向对象编程范式(OOP)在R语言中的实现进行了非常详尽的讲解,强烈推荐各位有志于进阶R语言编程的小伙伴儿进行阅读。R语言内目前可以实现OOP范式的一共有四套标准:S3、S4、RC、R6,其中关于S3、S4两种范式在早期的各种扩展包中使用比较多,...

发表了文章 • 2018-02-26 11:33 • 0 条评论

0
推荐
1612
阅读

R语言学习笔记——多进程与并行处理包parallel

上一篇中,主要介绍了使用foreach包来在R语言环境中实现任务的并行处理,其实在R语言中还有另外一个多进程包同样可以完成多进程任务,那就是parallel包,其语法与R语言内置的apply组函数以及plyr包内的_pply组函数一致。library("parallel") detectCores()           #计算计算机核心数:detec...

发表了文章 • 2018-02-26 11:27 • 0 条评论

17
推荐
4077
阅读

一个文科小白的数据分析师之路

大家好,我叫杜雨,就是那个公众号——“数据小魔方”的创建者和运营人,也是R语言中文社区多篇专栏文章的作者。承蒙天善社区不弃,我在天善智能课堂上线了四门微课程——《搞定矢量图形编辑,让你的图表美出新高度》,《R语言可视化在商务图表中的应用》,《用游戏的心态玩转Excel黑科技》,《R语言爬虫实战案例分享》。2017...

发表了文章 • 2018-01-26 22:56 • 16 条评论

0
推荐
1615
阅读

R语言多任务处理与并行运算包——foreach

相信大部分R语言初学者,在刚开始入门之处,都曾被告诫在处理多重复任务时,尽量不要使用显式的for循环,而要尽可能的使用R语言内置的apply组函数,这样可以极大地提高代码运行效率。但是实际上除了内的apply组函数之外,你还有另外一个更好地选择,就是利用一些支持并行运算的扩展包,来发挥本地计算机的多和计算优势。...

发表了文章 • 2018-01-15 10:42 • 0 条评论

0
推荐
1367
阅读

左手用R右手Python系列之——字符串格式化进阶

关于R语言字符串格式化之前无论是专题还是案例教程中均有所涉及,今日这一篇之所以重提是因为又找到了一个很好用的字符串格式化包。这个包的语法源于Python风格,这样可以让那些从Python迁移过来的R语言学习者无需额外的记忆负担,即可平稳掌握R语言中的字符串格式化语法。提到字符串格式化语法,我们一定能想到paste/pa...

发表了文章 • 2018-01-11 14:15 • 0 条评论

0
推荐
2135
阅读

左手用R右手Python系列——百度地图API调用与地址解析/逆解析

地理位置信息的解析与逆解析可能是我们在分析地理位置数据时所面临的最棘手的问题了,好在现在很多主流的在线 地图厂商地给开发者提供了免费的API接口调用。这一篇以百度地图API为例,演示如何在R语言以及Python中通过调用API实现地理位置的解析与逆解析,即将地址转换为具体经纬度,将经纬度转换为具体的地址。免费API...

发表了文章 • 2018-01-02 10:42 • 0 条评论

0
推荐
2289
阅读

R语言抓包实战——知乎live二级页面获取

之前曾经写过一篇关于知乎live课程信息爬取的短文,那个直接遍历的知乎live主页上展示的部分课程,仅仅是很小的一部分。今日这一篇将是该小项目的升级版,直接对live主页的课程按照模块进行二级页面的遍历,这样可以抓取更加丰富的课程信息,本次一共获取课程数目将近800+对于课程页抓包分析详情,这里不再赘述,想要了...

发表了文章 • 2018-01-02 10:31 • 1 条评论

1
推荐
1701
阅读

左手用R右手Python系列——面向对象编程基础

面向对象编程是程序设计中一种重要且高效的编程规范,它区别于常见的面向过程编程。在R语言以及Python的程序包开发过程中,大量使用了面向对象的编程范式。百度百科关于面向对象编程的权威解释是:面向对象程序设计(英语:Object-oriented programming,缩写:OOP)是一种程序设计范型,同时也是一种程序开发的方法。其...

发表了文章 • 2017-12-25 15:43 • 0 条评论

4
推荐
1668
阅读

左手用R右手Python系列——多进程/线程数据抓取与网页请求

这一篇涉及到如何在网页请求环节使用多进程任务处理功能,因为网页请求涉及到两个重要问题:一是多进程的并发操作会面临更大的反爬风险,所以面临更严峻的反爬风险,二是抓取网页数据需要获取返回值,而且这些返回值需要汇集成一个关系表(数据框)(区别于上一篇中的二进制文件下载,文件下载仅仅执行语句块命令即可,...

发表了文章 • 2017-12-19 10:42 • 0 条评论