张丹的博客专栏

张丹,R语言中文社区专栏特邀作者,《R的极客理想》系列图书作者,民生银行大数据中心数据分析师,前况客创始人兼CTO。 10年IT编程背景,精通R ,Java, Nodejs 编程,获得10项SUN及IBM技术认证。丰富的互联网应用开发架构经验,金融大数据专家。个人博客 http://fens.me, Alexa全球排名70k。 著有《R的极客理想-工具篇》、《R的极客理想-高级开发篇》,合著《数据实践之美》,新书《R的极客理想-量化投资篇》(即将出版)。

1
推荐
2039
阅读

在Ubuntu中安装Cassandra

前言Cassandra是由Facebook开发,然后开源的一套分步式数据存储系统,用于海量数据的高伸展性存储。Cassandra的无中心设计,一致性哈希,BloomFilter等技术是亮点。目录在Ubuntu中环境准备下载cassandra软件包配置Cassandra设置环境变量启动cassandra服务器用客户端访问cassandra1. 在Ubuntu中环境准备Cassandra是基于Ja...

发表了文章 • 2017-04-26 13:11 • 0 条评论

1
推荐
1730
阅读

在Ubuntu中安装Redis

前言Redis是常用基于内存的Key-Value数据库,比Memcache更先进,支持多种数据结构,高效,快速。用Redis可以很轻松解决高并发的数据访问问题;做为时时监控信号处理也非常不错。目录Redis在Windows中安装Redis在Linux Ubuntu中安装通过命令行客户端访问Redis修改Redis的配置1. Redis在Windows中安装在Windows系统上安装R...

发表了文章 • 2017-04-26 13:08 • 0 条评论

1
推荐
2159
阅读

R利剑NoSQL系列文章 之 Hive

第四篇 R利剑Hive,分为5个章节。Hive介绍Hive安装RHive安装RHive函数库RHive基本使用操作1. Hive介绍Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 ...

发表了文章 • 2017-04-25 15:42 • 0 条评论

1
推荐
2815
阅读

R利剑NoSQL系列文章 之 Cassandra

第三篇 R利剑Cassandra,分为7个章节。Cassandra介绍Cassandra安装RCassandra安装RCassandra函数库RCassandra基本使用操作RCassandra使用案例Cassandra的没落每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明与代码的连贯性。1. Cassandra介绍Apache Cassandra是一套开源分布式NoSQL数据库系统。它最初由Fac...

发表了文章 • 2017-04-25 15:33 • 0 条评论

1
推荐
2741
阅读

R利剑NoSQL系列文章 之 Redis

第二篇 R利剑Redis,分为4个章节。Redis环境准备rredis函数库rredis基本使用操作rredis使用案例每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明与代码的连贯性。第一章 Redis环境准备文字说明部分:首先环境准备,这里我选择了Linux Ubuntu操作系统12.04的64位服务器版本,大家可以根据自己的使用习惯选择...

发表了文章 • 2017-04-25 15:25 • 0 条评论

1
推荐
2586
阅读

R利剑NoSQL系列文章 之 MongoDB

第一篇 R利剑MongeDB,分为4个章节。MongoDB环境准备rmongodb函数库rmongodb基本使用操作rmongodb测试案例每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明与代码的连贯性。1. MongoDB环境准备文字说明部分:首先环境准备,这里我选择了Linux Ubuntu操作系统12.04的32位桌面版本,大家可以根据自己的使用习...

发表了文章 • 2017-04-24 13:57 • 0 条评论

2
推荐
2201
阅读

RHadoop培训 之 R基础课

前言覆盖R基础知识,快速上手,RHadoop环境的搭建基础课。目录背景知识开发环境R语法R基本函数R的扩展包1. 背景知识R起源R 是一个有着统计分析功能及强大作图功能的软件系统,是由奥克兰大学统计学系的Ross Ihaka和Robert Gentleman 共同创立。由于R 受Becker, Chambers & Wilks 创立的S 和Sussman 的Scheme两种语言...

发表了文章 • 2017-04-24 13:48 • 0 条评论

1
推荐
2268
阅读

RHadoop培训 之 Java基础课

前言覆盖java基础知识,快速上手,RHadoop环境的搭建基础课。目录背景知识开发环境JAVA的编译及运行环境JAVA语法JDK基本包介绍JAVA项目(ant, maven)1. 背景知识Java起源Java是由Sun Microsystems公司于 1995年5月推出的Java面向对象程序设计语言(以下简称Java语言)和Java平台的总称。由James Gosling和同事们共同研发...

发表了文章 • 2017-04-24 13:41 • 0 条评论

1
推荐
1916
阅读

RHadoop培训 之 Linux基础课

前言覆盖Linux基础知识,快速上手,搭建RHadoop环境的基础课。目录背景知识文件系统常用命令vi编辑器用户管理磁盘管理网络管理系统管理软件包管理常用软件1. 背景知识Linux起源Linux是一个诞生于网络、成长于网络且成熟于网络的奇特的操作系统。1991年,芬兰大学生Linus萌发了开发一个自由的UNIX操作系统的想法。Ubuntu ...

发表了文章 • 2017-04-24 13:27 • 0 条评论

3
推荐
1897
阅读

解决RHadoop错误:PipeMapRed.waitOutputThreads(): subprocess failed with code 1

前言一行错误难倒一片同学,今天在准备 统计之都沙龙 的时候,我也遇到相同的错误。就让我来解决一下,在使用rhadoop的rmr2中,经常会遇到的一个错误。按照 RHadoop实践系列之二:RHadoop安装与使用 rmr2中实例所演示。 > small.ints = to.dfs(1:10) > mapreduce(input = small.ints, map = function(k,...

发表了文章 • 2017-04-20 13:49 • 0 条评论

1
推荐
2312
阅读

RHadoop实践系列之四 rhbase安装与使用

第四篇 HBase和rhbase的安装与使用,分为3个章节。 1. 环境准备及HBase安装 2. rhbase安装 3. rhbase程序用例 每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明与代码的连贯性。注:Hadoop环境及RHadoop的环境,请查看同系列前二篇文章,此文将不再介绍。1. 环境准备及HBase安装文字说明部分:首先环境准备...

发表了文章 • 2017-04-20 13:42 • 0 条评论

4
推荐
2565
阅读

RHadoop实践系列之三 R实现MapReduce的协同过滤算法

第三篇 R实现MapReduce的协同过滤算法,分为3个章节。1.基于物品推荐的协同过滤算法介绍 2.R本地程序实现 3.R基于Hadoop分步式程序实现 每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明与代码的连贯性。注:Hadoop环境及RHadoop的环境,请查看同系列前二篇文章,此文将不再介绍。1. 基于物品推荐的协同过滤...

发表了文章 • 2017-04-20 13:35 • 0 条评论

1
推荐
2812
阅读

RHadoop实践系列之二:RHadoop安装与使用

第二篇 RHadoop安装与使用部分,分为3个章节。1. 环境准备 2. RHadoop安装 3. RHadoop程序用例 每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明与代码的连贯性。注:Hadoop环境搭建的详细记录,请查看 同系列上一篇文章 “RHadoop实践系列文章之Hadoop环境搭建”。由于两篇文章并非同一时间所写,hadoop版本...

发表了文章 • 2017-04-19 09:07 • 0 条评论

1
推荐
2419
阅读

RHadoop实践系列之一:Hadoop环境搭建

第一篇 Hadoop环境搭建部分,分为3个章节。Haddop环境准备 Hadoop完全分步式集群搭建 HDFS测试 每一章节,都会分为”文字说明部分”和”代码部分”,保持文字说明与代码的连贯性。Haddop环境准备文字说明部分:首先环境准备,这里我选择了Linux Ubuntu操作系统12.04的64位版本,大家可以根据自己的使用习惯选择顺手的Linux。...

发表了文章 • 2017-04-19 09:05 • 0 条评论

1
推荐
1937
阅读

桶排序的Nodejs实现

前言一个好的程序算法,可以提升百倍的程序性能。但并没有一种通用的算法,适用于所有场景。选择合适的算法,用在正确的地方,是一个好算法的开始。本文将用Nodejs实现桶排序算法。目录桶排序介绍桶排序算法演示Nodejs程序实现案例:桶排序统计高考分数1. 桶排序介绍桶排序(Bucket sort)是一种基于计数的排序算法,工作...

发表了文章 • 2017-04-17 09:24 • 0 条评论