风中的格桑花

数据分析学习记录,经验积累

1
推荐
2211
阅读

聚类分析的一些套路

聚类分析是一种比较常见算法,实际应用也很多,比如大家经常听到的RMF模型、分客群精准营销等都是聚类分析的应用。我们可以用“物以类聚、人以群分”来简单理解,它是一种无监督的分类算法。但是这种“简单”的算法,在运用到实际工作中会遇到很多问题,比如:①极端值的影响造成个别几个样本被聚为了一类,剩余绝大部分样本...

发表了文章 • 2019-01-13 15:18 • 0 条评论

1
推荐
4588
阅读

浅谈正态分布检验

正态分布是我们经常听到的一个名词,又叫高斯分布,许多模型或算法都要求数据服从正态分布,比如:pearson相关系数、线性回归等。样子如下:plot(density(rnorm(1000000))) # R语言代码关于正态分布的详细介绍可以参照 百度百科 维基百科,本文简单介绍一下正态分布在Excel、R和Python中的检验。1. 正态分布在Excel中的...

发表了文章 • 2019-01-12 20:44 • 0 条评论

0
推荐
2169
阅读

Python决策树图形输出

使用决策树建模时,我们需要将决策树输出出来,以直观的展示各决策节点,简单分享一下我的学习笔记。1. 建立模型# 导入库 from sklearn.datasets import load_iris from sklearn import tree iris = load_iris() # 建立并训练模型 clf = tree.DecisionTreeClassifier(max_depth=3) clf.fit(iris.data, iris.targ...

发表了文章 • 2018-10-17 17:26 • 0 条评论

1
推荐
1575
阅读

2.2.2 工作表的隐藏

在Excel工作簿文件中,我们经常需要隐藏一些数据不让别人看到,本文简单聊一下工作表的隐藏。先明确一下概念:Excel工作簿(workbook)和工作表(worksheet),可以简单的理解为一个Excel文件是一个工作簿,里面的各个sheet为工作表(但工作簿中并不是只有工作表!!)。打开一个新的工作簿,默认配置会包含三个工作表:...

发表了文章 • 2018-08-01 20:30 • 3 条评论

1
推荐
1476
阅读

2.2.1 表的使用

今天想简单设计一个模板,记录自己的学习记录,大致包含学习时间及内容等,里面用到了一些技巧,特别是表的技巧,写下来分享一下~Excel中的表,不是工作表sheet,也不是单元格区域range,它可以通过快捷键Ctrl+T生成,或者在插入选项卡中插入表格,表在下拉菜单中应用的非常广泛。1. 需求回归正题,现在我要做一张记录表...

发表了文章 • 2018-07-08 12:54 • 0 条评论

0
推荐
1895
阅读

1.1 Excel简介

1.Excel 简介首先来看一下“EXCEL”这个单词,发音:英[ɪkˈsel]美[ɪkˈsɛl],vt.优于、擅长;vi.胜过;但是大家提到这个单词,脑海中第一反应就是这是一个办公软件。来看看百度百科的介绍,呃,写的还是蛮官方的;我们再来看一下开始菜单中光标定位到Excel上的提示:“轻松发现、直观显示和共享数据中的见解”,呃,要不要这...

发表了文章 • 2018-06-26 22:18 • 0 条评论

3
推荐
2233
阅读

那些年做过的动态图表

前一段在部门内部分享Excel,忽然发现之前做过的一些动态图表,感觉还是比较实用的,分享给大家,希望大家多多提意见,有好的想法也非常欢迎与我沟通。1.Power ViewPower View是Excel2010之后的版本可以使用的,16版已经内置,最大的特点就是联动,点击上方的任意一块图表,其余图表都会跟着联动,视觉效果非常赞,但是...

发表了文章 • 2018-06-11 21:39 • 8 条评论

1
推荐
6576
阅读

一元(多元)线性回归分析之Python语言实现

写《一元(多元)线性回归分析之Excel实现》的时候就说还要写《一元(多元)线性回归分析之R语言实现》和在Python中的实现,其实本篇的文档早就准备好,但是一直没有找到关于模型的检验方法,所以一直迟迟没有发布,今天先把我知道的分享出来,希望看到的各位多多指导,不吝赐教。本文案例依然使用women数据集和salary数...

发表了文章 • 2018-06-11 21:12 • 0 条评论

5
推荐
6009
阅读

一元(多元)线性回归分析之R语言实现

上篇介绍了《一元(多元)线性回归分析之Excel实现》,本篇来探讨一下回归分析在R语言中的实现,我们将从更专业的角度对模型进行一些解读。1. 一元线性回归同样,我们仍然使用R中自带的women数据集,来看一下数据样式:1.1 数据探索首先做散点图查看数据的分布情况:plot(women$height, women$weight, xlab = "Heig...

发表了文章 • 2018-05-09 18:59 • 6 条评论

3
推荐
5818
阅读

一元(多元)线性回归分析之Excel实现

工作中最常用、最简单的估计就是一元(多元)线性回归分析了,比如预测销量等,今天来分享一下Excel的实现方法。1. 一元线性回归先说一元:使用R语言中的women数据集,记录了15为女性的身高和体重数据,我们需要建立一个模型,当得到一名女性的身高时,来预测她的体重。数据如下:1.1 数据探索共有15条记录,2列数据,首...

发表了文章 • 2018-05-05 18:54 • 0 条评论

2
推荐
2571
阅读

SAS新手入门感悟

虽然我是统计学专业的,大学时也学过一点SAS,但是对SAS一直存在“偏见”,认为其又丑又难学,不过当时是8.x的版本,界面确实很丑。因为工作原因,半年前开始学习并使用SAS了,这个被国内统计学学生嫌弃的统计学专业软件。先看了《SAS编程与数据挖掘商业案例》这本红皮书,看的晕乎乎的,看了两三遍吧!依然没有适应SAS的...

发表了文章 • 2018-04-22 10:07 • 0 条评论

0
推荐
2623
阅读

批量新建-获取文件名-重命名-归类

大家好,感谢你长得这么好看还关注我的博客,么么哒~刚写了批发邮件的博文,那么批发邮件中的附件怎样才能快速的分门别类的做好呢?一般来说,能用到批发邮件,说明文件是批量制作的,比如工作场景:把本月的营销数据分发给全国各个区域、办事处。所以一般都是先做一个总表,然后用VBA按照组织架构拆分成N个工作簿文件(...

发表了文章 • 2017-09-24 16:00 • 0 条评论

0
推荐
1993
阅读

批发邮件

大家好,感谢你长得这么好看还关注我的博客,么么哒~今天分享一下批发邮件的两种方法:方法一:邮件合并;方法二:VBA,下面简述之方法一:邮件合并,这个很容易实现,Word中自带功能,大家网上一搜就知道怎么操作了,不再赘述。此种方法的优点:①容易操作,只需要Word、Excel、Outlook三个MS Office组件协同即可;②能够...

发表了文章 • 2017-09-24 14:52 • 0 条评论

2
推荐
1826
阅读

R语言学习应用_客户APP注册刷单展示(续)

感谢你长得这么好看还关注我的博客,祝你天天开心,每天都是棒棒哒~上篇 https://ask.hellobi.com/blog/okajun/8101 展示了ggplot2的做图效果,留下了疑问“怎样更自动化发现并展示异常数据”,后来想起了shiny包,之前听说后没有仔细研究,现在打开官网,查看了11个内置案例,然后开始尝试实现自己想要的功能。...

发表了文章 • 2017-05-24 17:52 • 1 条评论

5
推荐
1997
阅读

R语言学习应用_客户APP注册刷单展示

      感谢你长得这么好看还关注我的博客,祝你天天开心,每天都是棒棒哒~      首先说明一下业务场景:公司有一款理财App产品(下文简称"捞小宝"),我们希望有更多的客户使用捞小宝来投资。使用手册:注册→认证→绑卡→投资,对销售的考核之一就是客户的注册量,恩,业务流程报告完毕!为...

发表了文章 • 2017-05-15 19:10 • 0 条评论