0
推荐
2369
阅读

【主站更新】聊聊 R 和 GPU

注:本文来自寇强的博客,原文请见 http://thirdwing.github.io/2013/09/27/rgpu/  。寇强:现为 Indiana University PhD in Informatics。微博:@没故事的生科男。这是一直想写几句的一个话题,既然今天有时间就聊一聊。GPGPU 算是近几年兴起的一个领域,以 CUDA 为代表,在高性能计算方面成果相当多。作为一种相...

发表了文章 • 2017-05-15 11:44 • 0 条评论

0
推荐
1911
阅读

嘿,朋友,抢红包了吗?

如果你有一台智能手机,如果你装了一个名叫微信的软件,那么你今年的春节很可能是在下面这样的场景中度过的(图片来自微信群):这也使得众多的网络大V发出了下面的感慨:而最近几天不少微信群里面又流行起来一种“红包接力”的玩法,大概的规则是:群里面先由一人发一个红包,然后大家开始抢,其中金额最大的那个人继续发...

发表了文章 • 2017-05-11 14:53 • 0 条评论

0
推荐
1880
阅读

xgboost: 速度快效果好的boosting模型

引言在数据分析的过程中,我们经常需要对数据建模并做预测。在众多的选择中,randomForest,gbm和glmnet 是三个尤其流行的R包,它们在Kaggle的各大数据挖掘竞赛中的出现频率独占鳌头,被坊间人称为R数据挖掘包中的三驾马车。根据我的个人经验,gbm包比同样是使用树模型的randomForest包占用的内存更少,同时训练速度...

发表了文章 • 2017-05-11 14:37 • 0 条评论

0
推荐
1881
阅读

用R测量灯泡的体积

缘起谈起测量灯泡体积,大家一定记得那个耳熟能详的故事。相传爱迪生发明灯泡的时候,让他的助手阿普顿测量一个灯泡的体积。助手用尺子进行了反复测量,并列出很很多公式,算了很久还没有算出来。爱迪生见罢,拿起那只灯泡,注满水后用量桶测出了体积。助手看了之后幡然醒悟,爱迪生主角光环大亮,随后开示了“不要钻牛角...

发表了文章 • 2017-05-11 14:19 • 0 条评论

2
推荐
3106
阅读

使用ggtree实现进化树的可视化和注释

本文作者:余光创,目前就读于香港大学公共卫生系,开发过多个R/Bioconductor包,包括ChIPseeker, clusterProfiler, DOSE,ggtree,GOSemSim和ReactomePA。进化树看起来和层次聚类很像。有必要解释一下两者的一些区别。层次聚类的侧重点在于分类,把距离近的聚在一起。而进化树的构建虽然也可以说是一个聚类过程,但侧重...

发表了文章 • 2017-05-10 09:47 • 0 条评论

0
推荐
2846
阅读

利用shiny包快速搭建可视化原型系统

作者:谢佳标 (乐逗游戏,深圳)前几周给大家分享了一篇《利用R语言进行交互数据可视化》的文章。文章末尾提到的在R的环境中,动态交互图形的优势在于能和knitr、shiny等框架整合在一起,能迅速建立一套可视化原型系统。今天接着给大家分享如何将动态交互图形与shiny框架整合在一起,迅速建立一套可视化原型系统。...

发表了文章 • 2017-05-10 09:33 • 0 条评论

1
推荐
2088
阅读

R语言做符号计算

编辑部按本文作者黄湘云于2011-2015年在中国矿业大学(北京)的数学与应用数学专业获得学士学位,并从2015-至今在中国矿业大学(北京)统计学专业硕士在读,主要研究复杂数据分析。引言谈起符号计算,大家首先想到的可能就是大名鼎鼎的Maple,其次是Mathematica,但是他们都是商业软件,除了其自身昂贵的价格外,对于想...

发表了文章 • 2017-05-10 09:04 • 0 条评论

0
推荐
1687
阅读

可能是目前最好的词云解决方案wordcloud2

注:广大的段子手朋友们,下次再用R做词云的时候,记得在wordcloud后面加个2无论是install.packages("wordcloud2")还是library(wordcloud2)或者wordcloud2(data)留下一个无法辩驳的理由,作为一个有情怀的语言,主函数的第一个变量不应该是data.frame么?最近写了一个wordcloud2的R包。调用一个JS的库(wordcloud2.js)实...

发表了文章 • 2017-05-09 10:25 • 0 条评论

0
推荐
1986
阅读

朝花夕拾(二)|《R时代,你要怎样画地图》

朝花夕拾(二)今天统计之都编辑部的新栏目——朝花夕拾又跟大家见面啦。在小编的深度发掘下,又一篇旧文章可以跳出来出现在大家面前啦。接下来的时间里小编会再接再厉,继续给大家分享有趣有用的内容哦。此间朝花老酒,愿于夕拾共温!本期文章:· 文章名称:《R时代,你要怎样画地图》· 文章作者:苏建冲· ...

发表了文章 • 2017-05-09 10:12 • 0 条评论

0
推荐
1376
阅读

为什么我不是R方的粉丝

本文翻译自 John Myles White 的博客 《Why I'm Not a Fan of R-Squared》。翻译工作已经获得作者授权同意。本文大意人们通常喜欢用R方作为评判模型拟合好坏的标准。与MSE和MAD不同,R方不只是模型误差的函数,它的定义中还隐含了两个模型的比较:一个是当前被分析的模型,一个是所谓的常数模型,即只利...

发表了文章 • 2017-05-03 16:23 • 0 条评论

0
推荐
1385
阅读

R与并行计算

作者简介,赵鹏,世界知名IT企业性能分析师。在包括多核、分布式以及GPU通用计算方面具有丰富的研究和实践经验,善于帮助客户解决性能问题以及提供并行化方案。R语言爱好者,业余时间创建了ParallelR网站,www.parallelr.com,以此来分享R和并行计算相关内容。 文章摘要,本文首先介绍了并行计算的基本概念,然后简...

发表了文章 • 2017-05-03 16:12 • 0 条评论

0
推荐
1828
阅读

热门数据挖掘模型应用入门(一): LASSO回归

作者简介:侯澄钧,毕业于俄亥俄州立大学运筹学博士项目, 目前在美国从事个人保险产品(Personal Line)相关的数据分析,统计建模,产品算法优化方面的工作。目录:模型简介线性回归Logistic回归Elstic Net模型家族简介学习资料1.模型简介Kaggle网站 (https://www.kaggle.com/ )成立于2010年,是当下最流行的进行...

发表了文章 • 2017-05-02 14:07 • 0 条评论

0
推荐
1880
阅读

朝花夕拾|showtext:字体,好玩的字体和好玩的图形

本期文章文章名称:《showtext:字体,好玩的字体和好玩的图形》文章作者:小轩哥文章时间:2014年1月本期小编:张心雨分享理由:小编作为一个本科僧,认为这篇文章提到的画图方法,可以直接用来放在各种社会调查报告里,对,就是样本描述的部分。如本期推送封面图所示,感觉画一个这样的图比放几个数字fancy多了吧...简...

发表了文章 • 2017-05-02 13:49 • 0 条评论

4
推荐
1970
阅读

一行R代码来实现繁琐的可视化

本文作者: 唐源,目前就职于芝加哥一家创业公司,曾参与和创作过多个被广泛使用的 R 和 Python 开源项目,是 ggfortify,lfda,metric-learn 等包的作者,也是 xgboost,caret,pandas 等包的贡献者。(喜欢爬山和烧烤 )ggfortify 是一个简单易用的R软件包,它可以仅仅使用一行代码来对许多受欢迎的R软件包结果进...

发表了文章 • 2017-05-02 12:03 • 0 条评论

0
推荐
1732
阅读

共轭梯度法计算回归

作者简介邱怡轩,中国人民大学统计学院硕士,普渡大学博士研究生共轭梯度示意图(图片来源:维基百科)引子之所以写这篇文章,是因为前几天统计之都的微信群里有同学提了一个问题,想要对一个很大的数据集做回归。然后大家纷纷给出了自己的建议,而我觉得共轭梯度算回归的方法跟这个背景比较契合,所以就正好写成一篇小...

发表了文章 • 2017-04-28 16:08 • 0 条评论