R语言中文社区

国内最大的R语言专业学习平台| R官方学习实践社区,提供R核心网站学习、视频直播 、R核心学习资源库、R全球会议资讯等内容!

2
推荐
11
阅读

吉林说R系列——第四篇:如何学习R语言

本文作者:王吉林现在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程,这就导致很多人不知道如何着手学习R语言。有幸的是,作者在暨南大学统计学系攻读研究生期间,王斌会教授开设了R语言相关课程,对R语言有了初步的认识,后来临近毕业,加入了人大经济论坛做版主,...

发表了文章 • 5 小时前 • 0 条评论

1
推荐
7
阅读

吉林说R系列第三篇(下):数据的分布、处理及模拟

本文作者:王吉林(十一)指数分布指数函数的一个重要特征是无记忆性(Memoryless Property,又称遗失记忆性)。这表示如果一个随机变量呈指数分布,当s,t>0时有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时...

发表了文章 • 5 小时前 • 0 条评论

4
推荐
90
阅读

吉林说R系列第三篇(上):数据的分布、处理及模拟

引言最近常看papi酱的周一放送,觉得很喜欢,她每次都可以从不同的角度,用欢乐的、幽默的、讽刺的语言搭配搞笑的、发人深省的动作揭示生活中各种现实问题,将事情的本质及人们在社会生活中的各种状态以简单、容易接受的方式表达出来。乍一看,你可能会觉得她有点怪怪的,但是细细体味,她说的不是很有道理吗?也许很少...

发表了文章 • 1 天前 • 0 条评论

3
推荐
14
阅读

吉林说R系列第二篇:如何进行数据读写

1.引言本周在刷微博的时候看到一篇博文叫做《一个农村女孩的自由》,写的真实感人,其内容折射出了中国农村很长一段时间的现状。人生的选择很多,选择代表了对某种事物的把握,也注定要失去另一些领域的体验,这就是机会成本。无论农村女孩是遵循父母的旨意辍学打工挣钱盖新房,然后结婚生子打麻将抑或是变土豪,还是咬...

发表了文章 • 1 天前 • 0 条评论

4
推荐
17
阅读

吉林说R图系列|第一篇:如何绘制各类图形

引言六月一个星期六的晚上,我静静地坐在顺德图书馆文筑书店的一张书台前看书,伸懒腰之际,无意间看到了龙应台的书籍(人生三本书),我随手拿起其中的一本——《目送》开始浏览,平实的文字却触动了我内心的灵魂。一种感伤的情绪在身体里慢慢沸腾,像吸了内功,走火入魔似的上蹿下跳。一晃毕业好多年了,离三十岁也仅有...

发表了文章 • 1 天前 • 0 条评论

1
推荐
28
阅读

R语言| 使用REmap绘制超炫酷的地图

  REmap这个包是通过调用百度地图API的一个程序包,与Google的ggmap包相比,不用翻墙就可以使用。其函数主要有:remap(),remapB()、remapC()、remapH()四个。该程序包目前要github网站上,因此我们需要从github上面下载安装。install.packages("devtools")#如果安装了就不需要这步 library(devtools) install_gith...

发表了文章 • 2 天前 • 0 条评论

3
推荐
25
阅读

借助caret包实现特征选择的工作

前言我们有一期的文章讲述了如何使用caret包进行数据的预处理,其中内容包括哑变量的创建、近零方差变了的筛选、数据标准化、缺失值处理、数据分割等。可以在教你使用caret包(一)--数据预处理获取更详细的内容介绍。下面我们接着讲讲如何使用caret包实现特征选择的任务。特征选择的实质就是在已有的变量基础上,选择部分...

发表了文章 • 2 天前 • 0 条评论

0
推荐
23
阅读

用数据解读摩羯智投

前言进入2016年,伴随世界经济危机的到来,中国互联网创业,也在经历长时间的寒冬,有不少的公司都因资金链断裂,停止了运营。与寒冬反差很大的是,AI技术却火了起来,受到资本的追捧。智能投顾作为金融领域的AI热点,一直在持续升温。到2016年底,招商银行发布了一个名为“摩羯智投”的应用,一下子吸引了众多人的眼球,...

发表了文章 • 2 天前 • 0 条评论

1
推荐
130
阅读

15分钟学会数据地图分析

什么都不说,先上一张最终的数据地图效果图,热力图部分是目标用户的分布,紫色和蓝色的购物车表示2种类型的商业购物场所。而深浅不一的蓝色格子块则代表房价。图1 最终效果图那么问题来了:这张图的制作需要哪些数据?你能从这张图上得到哪些信息?这张图能用到哪些地方?如果你对上述3个问题摸不着头脑,那很正常,因为这...

发表了文章 • 3 天前 • 0 条评论

1
推荐
311
阅读

运用R分析全唐诗与全宋词

宋词词云分析步骤主要由三部分构成:资料收集、词频统计、对比分析从网上共搜集唐诗4.8万首,宋词1400首;进过预处理过程之后,对其进行分词与词频统计,各取其词频数前50的词,罗列如下:再直观点,来个当今流行的词云图展示一下唐宋年代各自的流行词汇:唐诗词云宋词词云好了,数据准备工作算是完成了,接下来开始分析...

发表了文章 • 3 天前 • 0 条评论

3
推荐
226
阅读

借助tesseract包实现图片文本提取功能

2016年11月,Jeroen Ooms在CRAN发布了tesseract包,实现了R语言对简单图片的文本提取、分析功能。利用开源OCR引擎进行图片处理,目前可以识别超过100种语言,R语言可以借助tesseract调用OCR引擎进行相应操作。从图像中提取文本时,需要提前安装训练数据(地址:https://github.com/tesseract-ocr/tessdata),系统默认为...

发表了文章 • 4 天前 • 0 条评论

2
推荐
30
阅读

快讯| 12月R 新包发布

12月份,CRAN总计新增217个新包。这是过去9年以来数量增加最多的一个月。下文主要简单介绍其中部分R包,包括六个类别:数据类、数据科学、金融分析、统计类、工具类和可视化。金融分析类别需要特别注意,上月有六个R包是关于金融应用方面的。本文只做简单介绍,详情点击‘阅读原文’查看。【数据类】1. 包名:bea.R v...

发表了文章 • 5 天前 • 0 条评论

2
推荐
31
阅读

R文本挖掘初探之“天下风云出我辈, 一入江湖岁月催”(2)

原计划的4、5基本不打算去操作了,因为没有用到新的东西。这贴就记录下实现的过程,以及用到的知识和工具,期间遇到的各类问题及解决也会出现在这里。起先,贴一些文本挖掘相关的背景知识,从一些“前辈”的博客中摘录过来,这里会标明出处。文本挖掘大致可由三部分组成:底层是文本数据挖掘的基础领域,包括机器学习、数...

发表了文章 • 5 天前 • 0 条评论

1
推荐
36
阅读

收藏 | 全球大数据7大阵营,你都知道吗?

近几年,大数据行业已经逐渐成熟,在也不是大家谈之缥缈的行业,目前国内外从事这一行业的企业多入牛毛,但能称的上权威和代表,也都数的过来,下面我们就目前全球关于大数据行业所涉猎的范围作了一个分类,称其为7大阵营,以下是7大阵营的企业LOGO图。数据基础架构阵营大数据分析阵营大数据应用阵营架构与分析跨界阵营...

发表了文章 • 6 天前 • 0 条评论

3
推荐
41
阅读

量化投资教程:用R语言打造量化分析Web平台

概述和Python计算环境中的tushare包一样,在R中我们使用quantmod包接入第三方数据源,实现自定义量化分析平台的构建。本文打算以陌陌的股票分析为背景,介绍如何通过quantmod包构建专属的量化分析平台。什么是quantmodquantmod就是提供给宽客们使用的专业模块,Quantmod本身提供强大的数据接入能力,默认是雅虎财经的数...

发表了文章 • 2017-01-12 17:23 • 0 条评论