0
推荐
1499
阅读

R语言自然语言处理:文本向量化——词嵌入(Word Embedding)

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com前文推送:R语言自然语言处理:中文分词R语言自然语言处理:词性标注与命名实体识别R语言自然语言处理:关键词提取(TF-IDF)R语言自然语言处理:...

发表了文章 • 2019-04-08 10:07 • 0 条评论

0
推荐
1456
阅读

Sparklyr与Docker的推荐系统实战

概述大数据时代,做数据分析的人才辈出,Java、Scala、Go、Julia、Python、JavaScript都不断涌现出很多数据分析的新工具,然而对于数据分析来说,这些工具都不是分析的核心,分析的核心在于对市场业务、对具体数据的理解。相信你也见过太多脱离具体应用场景和业务数据而空谈算法的『数据分析大师』了。算法的文章在教科...

发表了文章 • 2019-04-08 10:03 • 0 条评论

0
推荐
1374
阅读

R语言ETL工程:连接(join)

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com本章将会介绍如何在R中完成数据表的连接操作。首先要明确一个问题:为什么要进行连接?本质上来说,连接就是按照一定的对应规则,把两个表格合并...

发表了文章 • 2019-04-08 09:56 • 0 条评论

0
推荐
852
阅读

shinydashboard与shiny_史上最全(四)

作者:李誉辉  四川大学在读研究生前言这是shinydashboard与shiny_史上最全第四篇,也是最后一篇。前文回顾:shinydashboard与shiny_史上最全(一) shinydashboard与shiny_史上最全(二)shinydashboard与shiny_史上最全(三)第一部分: 1 简介2 shiny文件的创建和运行3 shinydashboard  &nb...

发表了文章 • 2019-04-08 09:54 • 0 条评论

0
推荐
671
阅读

R可能让您惊喜的10件事

原文链接:https://simplystatistics.org/2019/03/13/10-things-r-can-do-that-might-surprise-you/在过去的几周里,我与一些来自计算机科学领域的人进行了一些互动,他们对R编程语言颇有微词。许多批评集中在R聚焦于统计分析的局限性上。的确,R有一个非常全面的CRAN、Bioconductor、Neuroconductor和ROpenSci分析包列...

发表了文章 • 2019-04-04 11:27 • 0 条评论

0
推荐
605
阅读

史上最污技术解读,让你秒懂IT术语

来源:知乎作者:我傻笑你跑掉首发:菜鸟教程链接:https://www.zhihu.com/question/263789393/answer/274245200假设你是一位妹子,你的男友沉迷游戏经常不接电话无故宕机,所以当你们约好下午逛街以后你要时不时地打个电话询问,看看他是不是还能正常提供服务,这叫心跳检测。假设你是一位妹子,你想去逛街而你的男友A...

发表了文章 • 2019-04-04 11:06 • 0 条评论

0
推荐
623
阅读

基于R语言绘制BBC风格图表

作者:吴健 中国科学院大学 R语言、统计学爱好者,尤其擅长R语言和Arcgis在生态领域的应用分享个人公众号:统计与编程语言 近日在google上浏览一篇文章《BBC Visual and Data Journalism cookbook for R graphics》,初看很简单,只需要安装bbplot包,然后该包只包含bbc_style()和finalise_plot()两个函数,但...

发表了文章 • 2019-04-04 11:03 • 0 条评论

0
推荐
697
阅读

再见虚拟机!在Win10中使用Linux版本的R和Python

“想象一下,你用 Linux 版本的 Tensorflow 建立了一个美妙的 RNN 模型,然后无缝切换到 Windows 用 Excel 直接编辑结果,画了一幅 fancy 的图给你的老板。在此期间,你的所有模型文件已经被自动同步到了 Onedrive/百度云/Dropbox 上了!整个过程丝毫没有使用虚拟机的“膈应”感!”写在前面相信在Windows中使用 Python 和 R...

发表了文章 • 2019-04-04 11:03 • 0 条评论

0
推荐
808
阅读

shinydashboard与shiny_史上最全(三)

作者:李誉辉  四川大学在读研究生前言这是shinydashboard与shiny_史上最全第三篇,前文回顾:shinydashboard与shiny_史上最全(一) shinydashboard与shiny_史上最全(二)第一部分: 1 简介2 shiny文件的创建和运行3 shinydashboard         3.1 标题栏(Header)  &...

发表了文章 • 2019-03-29 09:48 • 0 条评论

0
推荐
642
阅读

精选| 2019年2月R新包推荐

作者:Joseph Rickert翻译:黄小伟,10年资深数据矿工。目前就职杭州有赞数据分析团队,欢迎加入!2019年2月,151个R新包收录于CRAN(1月份收录153个新包)!以下是选摘的40个R新包,包括八个类别:生物信息、数据、机器学习、医学、统计学、时间序列、工具和可视化。一. 生物信息1. Cascade: 提供了一种建模工具,允...

发表了文章 • 2019-03-29 09:47 • 0 条评论

0
推荐
828
阅读

如何通过R建立流程图:DiagrammeR

作者:Anisa Dhana原文链接:https://datascienceplus.com/how-to-build-a-simple-flowchart-with-r-diagrammer-package/自从我学会了Markdown并且在RStudio使用R notebook生成高质量的PDF报告,我希望不再使用Microsoft Office。事实上,通过R Markdown,我可以完成所有事情,除非我需要制作流程图。流程图是一种代表工...

发表了文章 • 2019-03-22 15:03 • 0 条评论

0
推荐
1044
阅读

shinydashboard与shiny_史上最全(二)

作者:李誉辉  四川大学在读研究生前言这是shinydashboard与shiny_史上最全第二篇,上一篇:shinydashboard与shiny_史上最全(一)第一部分:1 简介2 shiny文件的创建和运行3 shinydashboard         3.1 标题栏(Header)       第二部分:    &n...

发表了文章 • 2019-03-20 10:47 • 0 条评论

0
推荐
726
阅读

R语言自然语言处理:关键词提取与文本摘要(TextRank)

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com关于提取关键词的方法,除了TF-IDF算法,比较有名的还有TextRank算法。它是基于PageRank衍生出来的自然语言处理算法,是一种基于图论的排序算法,...

发表了文章 • 2019-03-19 10:43 • 0 条评论

0
推荐
867
阅读

画ROC曲线的R包总结

作者: Joseph Rickert原文链接:https://rviews.rstudio.com/2019/03/01/some-r-packages-for-roc-curves/在这篇文章中,我将描述如何在CRAN中搜索绘制ROC曲线的包,并强调六个有用的包。虽然一开始我有一些想谈论的包的想法,像ROCR和pROC,我发现它们在过去是有用的,但我决定使用Gabor Csardi相对较新的包pkgse...

发表了文章 • 2019-03-19 10:43 • 0 条评论

0
推荐
496
阅读

R语言ETL系列:汇总(summarise)

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com本章讲解如何使用summarise函数完成数据的汇总。在开讲之前,我们需要理解,什么叫做汇总。举个例子,如果我们现在对学校的学生身高进行了测量,...

发表了文章 • 2019-03-18 09:38 • 0 条评论