张丹的博客专栏

张丹,R语言中文社区专栏特邀作者,《R的极客理想》系列图书作者,民生银行大数据中心数据分析师,前况客创始人兼CTO。 10年IT编程背景,精通R ,Java, Nodejs 编程,获得10项SUN及IBM技术认证。丰富的互联网应用开发架构经验,金融大数据专家。个人博客 http://fens.me, Alexa全球排名70k。 著有《R的极客理想-工具篇》、《R的极客理想-高级开发篇》,合著《数据实践之美》,新书《R的极客理想-量化投资篇》(即将出版)。

1
推荐
1694
阅读

R语言本地缓存memoise

前言缓存技术在计算机系统中运用地非常广泛,特别是对于重复性计算,缓存能为我们节省大量的CPU时间,可能是99%。R语言以统计计算著名,但其中很多算法包都是在进行大量重复的计算。优化正再进行,改变已经开始。以Hadley Wickham为代表的R语言领军人物,正在让R快起来!你感觉到了吗?!目录memoise介绍memoise安装memo...

发表了文章 • 2017-03-15 13:31 • 0 条评论

1
推荐
1673
阅读

用R解析Mahout用户推荐协同过滤算法(UserCF)

前言用R全面解析Mahout的基于用户推荐协同过滤算法(UserCF),改进的采用欧氏距离,并用R语言实现,与Mahout的结果进行对比。Mahout是Hahoop家族用于机器学习的一个框架,包括三个主要部分,推荐,聚类,分类!我在这里做的是推荐部分。推荐系统在现在的互联网应用中很常见,比如,亚马逊会推荐你买书,豆瓣会给你一个书评...

发表了文章 • 2017-03-15 09:19 • 0 条评论

1
推荐
1596
阅读

PageRank算法R语言实现

前言Google搜索,早已成为我每天必用的工具,无数次惊叹它搜索结果的准确性。同时,我也在做Google的SEO,推广自己的博客。经过几个月尝试,我的博客PR到2了,外链也有几万个了。总结下来,还是感叹PageRank的神奇!改变世界的算法,PageRank!目录PageRank算法介绍PageRank算法原理PageRank算法的R语言实现1. PageRank...

发表了文章 • 2017-03-15 08:53 • 0 条评论

1
推荐
1666
阅读

R语言中的遗传算法

前言人类总是在生活中摸索规律,把规律总结为经验,再把经验传给后人,让后人发现更多的规规律,每一次知识的传递都是一次进化的过程,最终会形成了人类的智慧。自然界规律,让人类适者生存地活了下来,聪明的科学家又把生物进化的规律,总结成遗传算法,扩展到了更广的领域中。本文将带你走进遗传算法的世界。目录遗传...

发表了文章 • 2017-03-14 16:05 • 0 条评论

1
推荐
1482
阅读

RMySQL数据库编程指南

前言MySQL是一款最常用到开源数据库软件,安装简单,运行稳定,非常适用于中小型的数据存储。R作为数据分析的工具,当然要支持数据库驱动接口。让R和MySQL配合在一起,所能爆发出的能量是巨大的。由于操作系统的原因,让Win和Linux有不一样的字符集,不一样的运行时环境。所以,今天我们讲一下如何在Linux和Win上面安装...

发表了文章 • 2017-03-14 15:22 • 0 条评论

1
推荐
1545
阅读

技术大牛如何寻找下一个风口

前言从大学毕业到现在,我做了10年IT编程的工作,从程序员到架构师,一路走来感触颇多,但我一直坚持着用程序改变世界的想法。自己对于编程的理解,有一定的深度,但是随着年龄的增长,越来越觉得自己力不从心。从早期的Java编程,1天写5000行的代码,还精神头十足,到现在用于R语言,1周写500行代码,更多地变成了思考...

发表了文章 • 2017-03-14 09:03 • 0 条评论

1
推荐
1580
阅读

均值回归,逆市中的投资机会

前言在股票市场中有两种典型的投资策略:趋势追踪(Trend Following) 和 均值回归(Mean Reversion)。 趋势追踪策略的特点在大行情的波动段找到有效的交易信号,不仅简单而且有效,我之前写的一篇文章 两条均线打天下 就属于趋势追踪策略。而均值回归策略则是一种反趋势策略,一波大幅上涨后容易出现下跌,而一...

发表了文章 • 2017-03-13 09:50 • 0 条评论

1
推荐
2364
阅读

R语言高效的管道操作magrittr

R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,...

发表了文章 • 2017-03-10 14:33 • 0 条评论

2
推荐
2551
阅读

R语言中文分词包jiebaR

R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,...

发表了文章 • 2017-03-10 10:14 • 0 条评论

1
推荐
2643
阅读

R语言解读多元线性回归模型

R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,...

发表了文章 • 2017-03-10 09:14 • 0 条评论

1
推荐
2472
阅读

当R语言遇上Docker

R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,...

发表了文章 • 2017-03-09 13:19 • 0 条评论

1
推荐
4658
阅读

R语言解读资本资产定价模型CAPM

如何使用IT技术,处理金融大数据。在互联网混迹多年,已经熟练掌握一些IT技术。单纯地在互联网做开发,总觉得使劲的方式不对。要想靠技术养活自己,就要把技术变现。通过“跨界”可以寻找新的机会,创造技术的壁垒。金融是离钱最近的市场,也是变现的好渠道!今天就开始踏上“用IT技术玩金融”之旅!前言伴随2016年中国金融...

发表了文章 • 2017-03-09 11:41 • 0 条评论

1
推荐
1952
阅读

caTools一个奇特的工具集

前言R语言生来就是自由的,不像Java,PHP等有统一的规范约束。R语言不仅命名、语法各包各异,就连功能也是各种混搭。caTools库就是这种混搭库,包括了不相关的几组函数工具集,有图片处理的,有编解码的,有分类器的,有向量计算的,有科学计算的。而且都很好用!以致于我都不知道,如何用简短的语言去描述这个包了!!...

发表了文章 • 2017-03-08 20:41 • 0 条评论

1
推荐
2474
阅读

R语言的高质量图形渲染库Cairo

前言R语言不仅在统计分析,数据挖掘领域,计算能力强大。在数据可视化上,也不逊于昂贵的商业。当然,背后离不开各种开源软件包的支持,Cairo就是这样一个用于矢量图形处理的类库。Cairo可以创建高质量的矢量图形(PDF, PostScript, SVG) 和 位图(PNG, JPEG, TIFF),同时支持在后台程序中高质量渲染!本文将介绍,Cairo在...

发表了文章 • 2017-03-08 20:33 • 0 条评论

1
推荐
1657
阅读

R和JSON的傻瓜式编程

前言JSON作为一种轻量级数据格式,被大量地应用在各种程序环境中。JSON(JavaScript Object Notation)是Javascript的内嵌的标准对象,同时也是MongoDB的表结构存储类型。JSON是半结构化的,可以表达出丰富的文档含义。JSON文档比XML文档要少很多,更适合于网络传输。早期R语言编程很少会用到JSON,但随着R语言的壮大,R也...

发表了文章 • 2017-03-08 09:07 • 0 条评论