精选|2018年9月R新包推荐

浏览: 1291

作者:Joseph Rickert

翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,目前就职杭州有赞

9月份,共有126个R新包收录于CRAN(8月份收录R新包160个),增幅连续下降,当然,这是R包经历过数量上快速增长后的正常变化。本期选摘了其中40个R新包,针对其主要功能做简单介绍,便于大家学习。包含八个类别:数据、金融、机器学习、科学、统计学、时间序列、工具和可视化,其中工具类R包将做重点介绍.

一. 数据

1. trigpoints : 提供British National Grid(OSGB36)坐标参考系统中历史GB标志点(帮助地图制作者和徒步旅行者的固定测量点)的完整数据集.

2. UKgrid : 提供自2011年以来英国国家电网需求数据(高压电力传输网络).


二. 金融

1. jubilee : 实现了Jubilee-Tectonic长期预测模型,用于预测美国股市的未来回报、国债收益率和黄金价格. ---量化同学可重点关注

2. portsort : 支持通过条件或无条件排序,将资产分类为最多三个因子的投资组合.

三. 机器学习

1. crfsuite : 针对CRFsuite进行封装,允许用户拟合条件随机场模型。重点是自然语言处理、有命名实体识别、文本分块、词性标注、意图识别和分类模型.

2. ELMSO : 实现Paulson, Luo和James(2018) 中描述的算法,该算法在一组在线广告机会中进行预算分配的实现.

3. embed : 提供使用简单的广义线性模型、非线性模型将因子预测变量转换为一个或多个数值表示的函数.

4. newsmap : 实施地理文件分类的半监督模型,同时包含英语、德语、西班牙语、日语和俄语的种子词典.

5. splinetree : 提供使用样条投影方法构建回归树、随机森林的功能.

6. stylest : 提供评价演讲者(作者)风格的独特性的功能.

四. 科学

1. conStruct : 提供一种将遗传数据映射为离散层组合的方法,在每个离散层内,相关性可能随地理距离不断衰减.

2. episcan : 提供一些有效的机制来扫描全基因组相互作用研究(GWIS)中的上位性,并支持病例对照状态(二元结果)和定量表型(连续结果)研究.

五.统计

1. ahpsurvey : 实现层次分析过程,一个由Saaty(1987)引入的通用多准则决策工具,它允许决策者权衡属性并评估呈现给属性的备选方案.

2. empirical : 实现经验单变量概率密度函数(连续函数)和经验累积分布函数(阶梯函数或连续函数).

3. basisMCMCplots : 提供用于检查来自NIMBLE软件包接口的单链、多链后验MCMC样本的功能.

4. MetaStan : 提供使用Stan进行贝叶斯元分析的函数,包括二项式 - 正态分层模型、使用弱信息先验的异质性参数、治疗效果参数等选项.

5. Opt4PL : 提供获取和评估3、4和5种参数逻辑回归模型的各种最佳设计的功能.

6. rmatalog : 实现了metalog分布,这是一种现代的、高度灵活的、数据驱动的分布.

7. rwavelet : 提供执行小波分析(正交和平移不变变换)的功能,同时进行数据压缩、去噪声.

8. samplingBigData : 提供对大数据集进行采样的方法,包括在多维空间中进行空间平衡采样.

9. survivalAnalysis : 实现高级接口封装以支持生存分析,包括Kaplan-Meier分析、对数秩检验、Cox回归.

10. ungroup : 提供实现惩罚复合链路模型的功能,有效地估计粗略分箱数据的平滑分布.

六. 时间序列

1. bayesdfa : 使用Stan实现贝叶斯动态因子分析,这是一种多变量时间序列的降维工具.

2. tbrf : 提供基于日期和时间窗口的滚动统计函数,而不是n-滞后观察.


七. 工具

1. atable : 提供创建临床试验报告、描述性统计和假设测试的功能,同时支持使用LaTeX或Word将结果排列在表中.

2. av : 实现与FFmpeg AV库的绑定,以便在R中处理音频和视频.

3. binb : 为RMarkdown中基于PDF的演示幻灯片提供一系列LaTeX样式.

4. broom.mixed : 将通过R中各种混合模型包拟合的对象转换为整洁的数据框格式.

5. codified : 允许作者使用元数据增加临床数据,以创建传统出版物、报告中使用的输出.

6. duawrangler : 允许对受保护元素的原始数据文件创建可共享数据集的功能.

7. ipc : 提供用于在R进程之间传递消息的工具,其中Shiny示例显示了如何执行有用的任务.

8. piggyback : 针对git的50MB提交限制,允许更大(最多2 GB)的数据文件附加到各个GitHub版本的存储库中. 

9. pysd2r : 使用reticulate包实现pysd的交互接口,提供大量的pysd函数,并且支持以Vensim、mdl或xmile格式读取文件.

10. radix : 提供基于Radix阅读器友好排版,可视化的灵活布局选项以及对脚注和引文的完全支持来格式化Web的科学和技术文章的功能.

11. rbtc : 实现比特币的RPC-JSON API,并为区块链的地址创建和内容分析提供实用程序功能.

12. salty : 允许用户获取真实或模拟数据,并将其与常见的错误相结合,例如伪OCR错误、Unicode问题、带有荒谬标点符号的数字字段、错误日期等.

八. 可视化

1. customLayout : 提供了graphics::layout()的扩展版本,允许用户通过组合更简单的布局为多个元素创建复杂的绘图区域.

2. echarts4r : 允许用户通过利用Echarts 、JavaScript库创建交互式图表,它包括33种图表类型、动画等内容.

3. ggparliament : 支持对议会的可视化,将选举结果可视化为建筑布局中的点. 

4. ggTimeSeries : 提供其他时间序列可视化,如日历热图、Steam Graph流图等.

说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~

推荐 1
本文由 R语言中文社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册