统计之都

专业、人本、正直的中国统计学门户网站

0
推荐
2863
阅读

利用shiny包快速搭建可视化原型系统

作者:谢佳标 (乐逗游戏,深圳)前几周给大家分享了一篇《利用R语言进行交互数据可视化》的文章。文章末尾提到的在R的环境中,动态交互图形的优势在于能和knitr、shiny等框架整合在一起,能迅速建立一套可视化原型系统。今天接着给大家分享如何将动态交互图形与shiny框架整合在一起,迅速建立一套可视化原型系统。...

发表了文章 • 2017-05-10 09:33 • 0 条评论

0
推荐
3214
阅读

汪张扬:深度学习中潜藏的稀疏表达

王杨卢骆当时体,轻薄为文哂未休。 尔曹身与名俱灭,不废江河万古流。— 唐 杜甫《戏为六绝句》(其二)【不要问我为啥放这首在开头,千人千面千理解吧】深度学习:概述和一孔之见深度学习(DL),或说深度神经网络(DNN), 作为传统机器学习中神经网络(NN)、感知机(perceptron)模型的扩展延伸,正掀...

发表了文章 • 2017-05-10 09:13 • 0 条评论

1
推荐
2104
阅读

R语言做符号计算

编辑部按本文作者黄湘云于2011-2015年在中国矿业大学(北京)的数学与应用数学专业获得学士学位,并从2015-至今在中国矿业大学(北京)统计学专业硕士在读,主要研究复杂数据分析。引言谈起符号计算,大家首先想到的可能就是大名鼎鼎的Maple,其次是Mathematica,但是他们都是商业软件,除了其自身昂贵的价格外,对于想...

发表了文章 • 2017-05-10 09:04 • 0 条评论

0
推荐
2054
阅读

有效统计实践的十大原则

引言数月前,广受好评的“十大原则”系列(“Ten Simple Rules” series)的创始人和长期作者Phil Bourne建议一些统计学家写一篇关于统计学“十大原则”的文章。(既然如何写好PLOS“十大原则”文章的原则之一就是请Phil Bourne加入作者群 [6], 我们希望在这对Phil的热情赞美也能达到足够的效果。)在如何写“十大原则”的指导方针[6...

发表了文章 • 2017-05-09 10:40 • 0 条评论

0
推荐
2194
阅读

互联网金融中的数据科学

最近几年,这波在资本撬动的互联网金融的浪潮极大地提升了数据科学的行业应用价值,数据分析师不再是苦逼的跑数的,摇身一变成了风控模型专家、数据科学家。尤其是大数据风控、大数据征信领域一片火热的场景,数据挖掘、机器学习相关专业同学的数量也翻番上涨,越来越多的计算机和统计领域的同学加入互联网金融行业。面...

发表了文章 • 2017-05-09 10:36 • 0 条评论

0
推荐
1707
阅读

可能是目前最好的词云解决方案wordcloud2

注:广大的段子手朋友们,下次再用R做词云的时候,记得在wordcloud后面加个2无论是install.packages("wordcloud2")还是library(wordcloud2)或者wordcloud2(data)留下一个无法辩驳的理由,作为一个有情怀的语言,主函数的第一个变量不应该是data.frame么?最近写了一个wordcloud2的R包。调用一个JS的库(wordcloud2.js)实...

发表了文章 • 2017-05-09 10:25 • 0 条评论

0
推荐
2014
阅读

朝花夕拾(二)|《R时代,你要怎样画地图》

朝花夕拾(二)今天统计之都编辑部的新栏目——朝花夕拾又跟大家见面啦。在小编的深度发掘下,又一篇旧文章可以跳出来出现在大家面前啦。接下来的时间里小编会再接再厉,继续给大家分享有趣有用的内容哦。此间朝花老酒,愿于夕拾共温!本期文章:· 文章名称:《R时代,你要怎样画地图》· 文章作者:苏建冲· ...

发表了文章 • 2017-05-09 10:12 • 0 条评论

1
推荐
1472
阅读

用交互式图形探索一个五百年前的脑洞

按惯例先跑几段火车,赶时间的请直接从下面油画处开读。我很少看电影,欠的稿子都写不完还看毛线电影,不过前段时间《大鱼海棠》的精美海报画面还是吸引了我的注意力(又是从涛妹的票圈看到的),深为赞叹现在国内的动画制作技术。然而过了几天,好像评论的风向就变了。可惜了情怀这个词,现在也成了为人不齿的陈词滥调...

发表了文章 • 2017-05-03 16:36 • 0 条评论

0
推荐
1383
阅读

为什么我不是R方的粉丝

本文翻译自 John Myles White 的博客 《Why I'm Not a Fan of R-Squared》。翻译工作已经获得作者授权同意。本文大意人们通常喜欢用R方作为评判模型拟合好坏的标准。与MSE和MAD不同,R方不只是模型误差的函数,它的定义中还隐含了两个模型的比较:一个是当前被分析的模型,一个是所谓的常数模型,即只利...

发表了文章 • 2017-05-03 16:23 • 0 条评论

0
推荐
1393
阅读

R与并行计算

作者简介,赵鹏,世界知名IT企业性能分析师。在包括多核、分布式以及GPU通用计算方面具有丰富的研究和实践经验,善于帮助客户解决性能问题以及提供并行化方案。R语言爱好者,业余时间创建了ParallelR网站,www.parallelr.com,以此来分享R和并行计算相关内容。 文章摘要,本文首先介绍了并行计算的基本概念,然后简...

发表了文章 • 2017-05-03 16:12 • 0 条评论

3
推荐
1437
阅读

Python的七种武器

 君子生非异也,善假于物也。 “物”能够延展英雄的能力。它是吕布的赤兔马,杨过的玄铁重剑,CS中的沙漠之鹰,曹操传中的凤凰羽衣。“物”也可用以治愈英雄,例如张无忌的黑玉断续膏,李逍遥的天香续命露,还有深夜里TVB的一碗面。 对于不同的位面,有着不同的宝物定义。对古时文人来讲,笔墨纸砚,是当时具...

发表了文章 • 2017-05-03 15:56 • 0 条评论

0
推荐
1849
阅读

热门数据挖掘模型应用入门(一): LASSO回归

作者简介:侯澄钧,毕业于俄亥俄州立大学运筹学博士项目, 目前在美国从事个人保险产品(Personal Line)相关的数据分析,统计建模,产品算法优化方面的工作。目录:模型简介线性回归Logistic回归Elstic Net模型家族简介学习资料1.模型简介Kaggle网站 (https://www.kaggle.com/ )成立于2010年,是当下最流行的进行...

发表了文章 • 2017-05-02 14:07 • 0 条评论

0
推荐
1892
阅读

朝花夕拾|showtext:字体,好玩的字体和好玩的图形

本期文章文章名称:《showtext:字体,好玩的字体和好玩的图形》文章作者:小轩哥文章时间:2014年1月本期小编:张心雨分享理由:小编作为一个本科僧,认为这篇文章提到的画图方法,可以直接用来放在各种社会调查报告里,对,就是样本描述的部分。如本期推送封面图所示,感觉画一个这样的图比放几个数字fancy多了吧...简...

发表了文章 • 2017-05-02 13:49 • 0 条评论

4
推荐
1980
阅读

一行R代码来实现繁琐的可视化

本文作者: 唐源,目前就职于芝加哥一家创业公司,曾参与和创作过多个被广泛使用的 R 和 Python 开源项目,是 ggfortify,lfda,metric-learn 等包的作者,也是 xgboost,caret,pandas 等包的贡献者。(喜欢爬山和烧烤 )ggfortify 是一个简单易用的R软件包,它可以仅仅使用一行代码来对许多受欢迎的R软件包结果进...

发表了文章 • 2017-05-02 12:03 • 0 条评论

0
推荐
1744
阅读

共轭梯度法计算回归

作者简介邱怡轩,中国人民大学统计学院硕士,普渡大学博士研究生共轭梯度示意图(图片来源:维基百科)引子之所以写这篇文章,是因为前几天统计之都的微信群里有同学提了一个问题,想要对一个很大的数据集做回归。然后大家纷纷给出了自己的建议,而我觉得共轭梯度算回归的方法跟这个背景比较契合,所以就正好写成一篇小...

发表了文章 • 2017-04-28 16:08 • 0 条评论