精选|2018年7月R新包推荐

浏览: 2170

作者:Joseph Rickert

翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,目前就职网易杭州


7月份,大约有251个R新包收录于CRAN。除7月份新包数量远超6月份之外,R新包的质量和多样性上也有明显的进步。比如tropicalSparse,抽象数学研究与分析;eChem,分析化学方向的研究应用。

以下是节选的40个R新包,主要包括十个类别:计算方法、数据、经济、机器学习、数学、科学、统计学、时间序列、工具和可视化。

一. 计算方法

1. osqp: 提供了与OSQP求解器的绑定(数值优化), 用于求解基于C语言编写的凸二次型程序.

2. sundailr: 提供一种在SUNDIALS中调用函数的方法.

二. 数据

1. fredr: 支持在R中获取美联储经济数据 (FRED),并进行相关分析与研究.

2. jstor: 提供导入元数据、ngrams和全文的功能,进行研究分析.

3. rLandsat: 提供使用Development Seed和美国地质调查局构建的API搜索和获取Landsat数据的功能.

4. weathercan: 提供从加拿大环境和气候变化网站下载历史天气数据的工具,可以在特定日期范围内从多个工作站下载数据,并自动处理为单个数据集.


三.经济

1. beezdemand: 支持在行为经济需求研究中进行的分析,包括Stein等人(2015)提出的数据筛选和模型拟合等多种方法.

2. sgmodel: 对于用户给定的参数,提供计算通用随机增长模型解的函数.

四. 机器学习

1. bigdatadist: 提供函数来计算概率、曲线样本的熵、函数数据的距离和深度度量以及高维数据的广义马氏核距离.

2. L0Learn提供了一个优化的工具包,用于近似解决L0规则化的学习问题.

五. 数学

1. tropicalSparse: 通过应用稀疏矩阵存储技术,实现了稀疏矩阵的一些基本热带代数计算功能.

六. 科学

1. eChem: 提供用于分析化学课程的工具,函数模拟循环伏安法、线性扫描伏安法、单脉冲和双脉冲计时安培法、以及利用Brown(2015)中概述的隐式有限差分法进行计时比例尺实验.

2. RaceID: 利用Herman、Sagar和Grun D.的StemID2算法,实现细胞类型推断和谱系树预测(2018).

3. updog: 实施经验贝叶斯方法,从下一代测序数据中对多倍体进行基因分型,同时考虑等位基因偏差、过度离散和测序错误.

七.统计学

1. adaptMT: 实现了自适应的p值阈值(AdaPT),包括一个允许用户指定任何算法来学习本地错误发现率的框架、以及一个实现特定算法的便捷函数池.


2. biglmm: 针对无法直接加载进内存的数据,提供回归模型构建的功能.

3. circumplex: 提供用于分析和可视化循环数据的工具,包括Zimmermann&Wright(2017)的自举结构汇总方法的概括、以及从结果中创建出版物表和数字的功能.


4. MultiFit: 提供测试两个随机向量的独立性的功能.

5. PHEIndicatormethods: 支持使用制定英国公共卫生指标(如通过指尖提供的指标)的方法,计算常用的公共卫生统计数据及其置信区间.

6. robmixglm: 使用混合方法实现稳健的广义线性模型(GLM),如Beath(2018)中所述.

7. SingelCaseES: 提供计算单个案例设计中基本效应指数的功能,包括几个非重叠测量和参数效应大小测量、以及用于估计Swan和Pustejovsky(2018)开发的渐进效应模型等.

8. spCP: 实现具有独特截距、斜率、方差截距和斜率以及每个位置均为变化点的空间变点模型. 

9. TDAstats: 提供拓扑数据分析工具集,特别是计算Vietoris-Rips复合体中的持久同源性.

八.时间序列

1. rollRegress: 实现快速滚动和扩展线性回归模型的方法.

九.工具

1. anyLib: 提供从CRAN、Bioconductor和GitHub安装、加载包列表的功能.

2. dbx: 提供选择、插入、更新和删除数据操作的功能,目前支持的数据库主要

PostgreSQLMySQLSQLite.

3. envnames: 提供函数来跟踪用户定义的环境名,其无法使用基本R函数environmentName()进行检索。这个包中的主函数environment_name()将环境的名称作为参数返回.

4. librarian: 提供在单个函数调用中自动安装、更新和加载CRAN和GitHub上R包的函数.

5. makeParallel: 提供自动将串行R代码转换为更高效的并行版本的功能.

6. metaDigitise: 提供从研究论文中的已发表数据中提取、汇总和数字化数据的功能.

7. RSuite: 提供一组与R Suite一起使用的工具,用于开发数据科学工作流程.

十.可视化

1. ceterisParibus: 提供在特征空间中的选定点周围创建“假设?”模型响应图的功能.

2. cytofan: 在ggplot2中实现细胞计数数据的可视化展示.

3. fingertipscharts: 针对英国Fingertips站点上提供的公共健康数据,支持可视化的优化.

4. ggvoronoi: 借助deldir和ggplot2,提供函数创建、操作和可视化沃龙诺依图.

说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~


公众号后台回复关键字即可学习

回复 爬虫            爬虫三大案例实战  
回复 Python       1小时破冰入门

回复 数据挖掘     R语言入门及数据挖掘
回复 人工智能     三个月入门人工智能
回复 数据分析师  数据分析师成长之路 
回复 机器学习      机器学习的商业应用
回复 数据科学      数据科学实战
回复 常用算法      常用数据挖掘算法

image.png

推荐 0
本文由 R语言中文社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册