R语言实战

一起探索发现R语言之美 R语言入门及进阶案例 R语言的常用包介绍 R语言数据分析与可视化

0
推荐
1847
阅读

深圳购房投资笔记(一):楼市有泡沫吗?(上)

(一) 开始筹备在深圳买房          2018年2月12号坐上上海回深圳的火车第二天开始,一直到除夕农历初五,整整一个春节8天的假期,减去除夕和初一初二的日子。有5天时间,我一直在龙岗区看房子。春节的深圳,许多业主已经回老家过春节,就连深圳大部分的卖房中介店铺只有一个销售留守深圳值班。...

发表了文章 • 2018-10-26 22:37 • 0 条评论

1
推荐
2489
阅读

R VS Python —— KNN

本文的主要内容就是针对经典的Breast Cancer Wisconsin (Diagnostic)数据,分别通过R和Python两种语言去实现KNN分类算法。本文的R代码源于Brett Lantz的《Machine Learning with R》书籍第三章。当然这本书大家也不少人看过,并且也看过很多的有关这个案例的分析,今天我就给大家用两种语言去对比实现此案例的实战。文章...

发表了文章 • 2018-03-12 20:50 • 0 条评论

3
推荐
3875
阅读

实战案例:贷款分析之plotly VS ggplot2

                                                          本文选用一个比较大的贷款数据集进行简单的探索分析,主要目的是想让读者体会到经典的ggplot2和...

发表了文章 • 2018-03-03 15:55 • 0 条评论

8
推荐
3357
阅读

实战案例:探索星巴克的世界分布

       星巴克,诞生于美国西雅图,靠咖啡豆起家,自1971年正式成立以来,从来不打广告,却在近20年时间里一跃成为巨型连锁咖啡集团,其飞速发展的传奇让全球瞩目。星巴克不仅将丑小鸭变成白天鹅的奇迹演绎得淋漓尽致,它背后还隐藏着动人的故事。额...有兴趣读者自己查去吧,我就不多占篇幅了!!...

发表了文章 • 2018-02-28 17:36 • 1 条评论

2
推荐
2776
阅读

实战案例:贷款发放决策

                                                                                  贷款...

发表了文章 • 2018-02-23 22:10 • 2 条评论

1
推荐
2036
阅读

经典Kaggle之泰坦尼克(下)

                            上一期我们对泰坦尼克数据进行了部分预处理和可视化探索,这一期继续我们的可视化探索和建模预测。这一期文章主要包括了部分可视化探索、交叉验证、建模预测和模型评估。## 可视化探索## Fare VS Survived p_F...

发表了文章 • 2018-02-19 14:47 • 0 条评论

2
推荐
2455
阅读

经典Kaggle之泰坦尼克(上)

                                       1912年4月15日,载着1316号乘客和891名船员的豪华巨轮泰坦尼克号与冰山相撞而沉没,这场海难被认为是20世纪人间十大灾难之一。1985年,泰坦尼克号的沉船遗骸在北大...

发表了文章 • 2018-02-19 12:19 • 0 条评论

4
推荐
2546
阅读

扎心实战案例:麻(shi)雀(zhan)虽小,五脏俱全

                                                         首先呢,猜测一下家的心思:这个推文是啥,标题这么奇怪;哇,推文开头的玻璃(还是碎玻璃)是啥?!...

发表了文章 • 2018-02-14 13:24 • 0 条评论

2
推荐
3424
阅读

共享单车租用频次分析

                                                             2016年底以来,国内共享单车突然就火爆了起来。在街头,仿佛一夜之间,共享单车已经到...

发表了文章 • 2018-02-03 17:46 • 0 条评论

2
推荐
3100
阅读

从零开始,小白如何通过Kaggle竞赛提高数据分析能力!

Kaggle是由联合创始人、首席执行官Anthony Goldbloom和Ben Hamner于2010年在墨尔本创立,主要为开发商和数据科学家们提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。其最重要的价值体现在可以让竞赛者尽可能的去使用和设计建模方法去解决现实中的难题,促进社会的发展。持续到现在,Kaggle已经发展了7年了。...

发表了文章 • 2018-02-01 20:09 • 2 条评论

2
推荐
2278
阅读

apply家活跃成员小聚会

在R中经常会用到一些循环,对于数据量较小的数据,我们使用for循环之类的显循环也没发现什么弊端,但是针对数据量较大的数据,依旧使用显循环,就会发现R中的显循环效率真低!!!那么,今天我们针对apply家族,去总结和对比向量计算和显循环计算。# applyapply(X, MARGIN, FUN, ...)    X:数组、矩阵、数据...

发表了文章 • 2018-01-31 11:14 • 2 条评论

2
推荐
2124
阅读

R for data science 之 stringr包

stringr包常用函数总结stringr包是伟大的Hadley Wickham开发的处理字符串的程序包,该包包含的函数如下图:这篇文章我会给大家举例讲解其中的几个常用函数,如果大家想详细的了解每个函数的具体用法,可以使用帮助函数help()去查看。一、初识字符串字符串是几乎在所有编程语言中可以实现的非常重要和有用的数据类型。...

发表了文章 • 2018-01-29 16:44 • 0 条评论

2
推荐
3360
阅读

R可视化分析美国的肥胖症,嘿!

本文章的主要目的是想研究美国成年人、儿童以及青少年中肥胖人口最多的州。其次展示如何在R中使用rvest包从HTML页面中抓取数据、以及使用ggplot绘制地图。使用R去做项目的时候,经常会用到R社区的成员开发的程序包,为我们的数据重塑、特征选择以及后续建模等提供了一些列的方便。话不多说,先感谢一波......首先呢,我...

发表了文章 • 2018-01-26 17:37 • 0 条评论

2
推荐
3040
阅读

kaggle数据科学社区调查报告

附视频链接: 天善智能Kaggle十大案例精讲(连载中)  提供案例代码和数据,可以实操。欢迎学习!(数据集和代码在链接公告处提供下载)2017年8月26日,全球最大的数据科学社群Kaggle发布了数据科学/机器学习业界现状全行业调查的数据集。调查问卷数据从2017年8月7日~8月25日收集。受访者囊括了来自50多个国...

发表了文章 • 2017-12-25 11:14 • 1 条评论

1
推荐
2357
阅读

R for data science之purrr包(下)

head_while() 找到所有满足头部匹配的值 tail_while() 找到所有满足尾部匹配的值mtcars[1,] mtcars[1,] %>% head_while(~. >5)mtcars[1,] %>% head_while(~. >15)mtcars[,1] mtcars[,1] %>% tail_while(~. >25)mtcars[,1] %>% tail_while(~. >21)fun <- function(x) x >= 1 head_whi...

发表了文章 • 2017-12-24 00:44 • 0 条评论