数据分析

数据分析

0
推荐
15
浏览

2018年 九大改变世界的技术趋势

技术的世界正在爆炸式发展,“日新月异”不再是一个修辞,而是正在发生的现实。在这其中,有一些发展趋势注定要改变世界,改变我们的生活方式。在此,我们借鉴美国大数据专家Bernard Marr的观点,为大家介绍2018...

数据观 发表了文章 • 7 小时前

0
推荐
15
浏览

一元(多元)线性回归分析之Excel实现

作者简介okajun个人博客:https://ask.hellobi.com/blog/okajun工作中最常用、最简单的估计就是一元(多元)线性回归分析了,比如预测销量等,今天来分享一下Excel的实现方法。1. 一元线性回归先说一元:使用R语...

R语言中文社区 发表了文章 • 8 小时前

1
推荐
17
浏览

为jupyter_notebook增加目录

前言jupyter_notebook是数据相关岗位从业者的一个不错的选择,很清晰、很方便,可以将分析过程和分析结果同步显示在一起。但是有的时候随着你的分析增多,你的代码就会变得很长,这个时候就需要目录这样的功能,...

张俊红 发表了文章 • 13 小时前

0
推荐
37
浏览

R语言实现统计分析——非参数假设检验

作者:糖甜甜甜 公众号:经管人学数据分析往期回顾:词云一分钟了解周董的歌词非参数检验是指总体不服从正态分布,且分布情况不明时,用来检验数据是否来自同一个总体假设等一类检验方法。非参数检验通常是...

R语言中文社区 发表了文章 • 1 天前

0
推荐
49
浏览

小微企业的福音,大道至简的办公化BI

请点击此处输入图片描述还记得上次小麦跟大家聊的SaaS BI吗?详情见文章《无需浏览器 ,这样的SaaS BI,你喜欢吗?》,小微企业等轻量级BI用户一直被商业智能BI应用所“排挤”,硬件环境跟不上、人才跟不上,想想真...

大麦 发表了文章 • 1 天前

1
推荐
41
浏览

五个步骤,搭建企业的“大数据视野”

大数据时代,大多数企业都对大数据寄予厚望。通过数据分析,企业既能够实现危机预警,也能做到洞察先机。但是,企业规模不同、数据应用的成熟度不同,大数据技术的发展更是一日千里。俗话说,“一口气吃不成胖...

数据观 发表了文章 • 2 天前

0
推荐
54
浏览

数据城堡参赛代码实战篇(四)---使用pandas合并数据表

作者:文文个人公众号:小小挖掘机(ID:wAIsjwj)前文传送门:数据城堡参赛代码实战篇(三)---使用pandas合并数据表 数据城堡参赛代码实战篇(二)---使用pandas进行数据去重 数据城堡参赛代码实战篇...

Python爱好者社区 发表了文章 • 2 天前

1
推荐
62
浏览

词云一分钟了解周董的歌词

作者简介糖甜甜甜,R语言中文社区专栏作者公众号:经管人学数据分析前段时间周董发布了一首新歌《不爱我就拉倒》被网友吐槽土味十足,这段时间有本科同学让我帮忙做词云,所以借此机会把代码记录下了,顺便借周董...

R语言中文社区 发表了文章 • 2 天前

1
推荐
91
浏览

假设检验的第1种类型:如何使用Python实现单样本检验

看下面内容前,我假设你已经学习了前面的:如何用最通俗易懂的方式理解假设检验。并了解了假设检验的基本步骤:下面我们通过一个案例来聊聊假设检验的第1种类型:单样本检验。“超级引擎”是一家专门生产汽车引擎的...

猴子聊人物 发表了文章 • 3 天前

2
推荐
38
浏览

R语言绘制条形图

条形图可以通过垂直或水平的条形展示类别型变量的分布。熟悉R语言的用户应该都可以熟练的绘制条形图,但在实际应用中,我们常常会根据数据展示的需求对条形图进行调整,这就需要我们花费大量时间了解条形图绘制函...

R语言中文社区 发表了文章 • 5 天前

0
推荐
83
浏览

数据可视化助你提早发现设备存在的隐患

来自:数据观 https://www.shujuguan.cn/?from=tszn 设备正常运行是保证正常生产的前提。尽管现在的物联网、安全生产预警系统等先进设备已经能够帮助企业快速发现问题并提供成熟的解决方案,但是,我国的许多企...

数据观 发表了文章 • 6 天前

1
推荐
42
浏览

Sklearn参数详解—LR模型

最近开始一个新的系列,sklearn库中各模型的参数解释,本篇主要讲述最基础的LR模型。模型参数详解逻辑回归:sklearn.linear_model.LogisticRegression(penalty='l2', dual=False,         to...

张俊红 发表了文章 • 6 天前

0
推荐
76
浏览

数据城堡参赛代码实战篇(三)---使用pandas合并数据表

作者:文文个人公众号:小小挖掘机(ID:wAIsjwj)前文传送门:数据城堡参赛代码实战篇(一)---手把手教你使用pandas数据城堡参赛代码实战篇(二)---使用pandas进行数据去重关注Python爱好者社区,回复"数据代码...

Python爱好者社区 发表了文章 • 6 天前

2
推荐
138
浏览

如何入手数据科学竞赛——以kaggle为例

一些初学者会犹豫要不要参加 Kaggle 竞赛,这并不让人奇怪,他们通常有以下顾虑:我该如何开始?我要和经验丰富的博士研究者比赛吗?如果没有获胜的机会,还值得参与吗?这就是数据科学吗?(如果我在 Kaggle 上...

Python爱好者社区 发表了文章 • 2018-05-16 15:44

0
投票
1
回答
63
浏览

各位大神 小女子求帮助

许胜利 回复了问题 • 2018-05-16 09:17
条新动态, 点击查看
因为人都有惰性,已经习惯了EXCEL,就不愿再去学习其他新工具了。
所以对我们是个机会,只要坚持学习,早晚会脱颖而出的。
因为人都有惰性,已经习惯了EXCEL,就不愿再去学习其他新工具了。
所以对我们是个机会,只要坚持学习,早晚会脱颖而出的。
唐太宗

唐太宗 回答了问题 • 2017-04-01 11:16 • 2 个回复 不感兴趣

BIEE12C回写配置问题

赞同来自:

已经解决,是模板问题!!
已经解决,是模板问题!!
程序本地写,测试时候发到你的服务器上去跑。
程序本地写,测试时候发到你的服务器上去跑。
你的目的是减少文件的个数,设置合理的分区数就可以了,例如设置分区数为5,对应5个文件。coalesce和repartitions都能设置分区数量,其底层原理有稍微的差别。从你的问题来看应该是设置的分区数太少,导致并行度不够,故写入速度慢。意见是尝试吧分区数调整... 显示全部 »
你的目的是减少文件的个数,设置合理的分区数就可以了,例如设置分区数为5,对应5个文件。coalesce和repartitions都能设置分区数量,其底层原理有稍微的差别。从你的问题来看应该是设置的分区数太少,导致并行度不够,故写入速度慢。意见是尝试吧分区数调整为5或10再试试
 只能提供个思路:首先你不是已经找到了,那些是机器人发的那些是正常粉丝发的评分 (取出相关特征值)
                            然后你给这些数据打上标签(比如说1、表示是正常人 0、表示机器人的)
                 ... 显示全部 »
 只能提供个思路:首先你不是已经找到了,那些是机器人发的那些是正常粉丝发的评分 (取出相关特征值)
                            然后你给这些数据打上标签(比如说1、表示是正常人 0、表示机器人的)
                            最后打好标签后,通过机器学校算法(贝叶斯、决策树 随机森林啊,等一大堆的),来进行判定 
这个不复杂吧,就是处理下结束 时间而已  结束时间等于 开始时间 + 分钟(结束时间-开始时间)*0.75
这个不复杂吧,就是处理下结束 时间而已  结束时间等于 开始时间 + 分钟(结束时间-开始时间)*0.75
实际上,在传统企业混数据分析反而比互联网公司简单。因为传统企业的职能架构比较规范,一个萝卜一个坑,不会跟着项目或者业务线变动而剧烈变动,所以说句大实话:在传统企业做数据分析,不是怎么做的复杂的问题,而是怎么混上位的问题。只要能混上位,管他搞什么呢。
 
如果站... 显示全部 »
实际上,在传统企业混数据分析反而比互联网公司简单。因为传统企业的职能架构比较规范,一个萝卜一个坑,不会跟着项目或者业务线变动而剧烈变动,所以说句大实话:在传统企业做数据分析,不是怎么做的复杂的问题,而是怎么混上位的问题。只要能混上位,管他搞什么呢。
 
如果站在上位角度思考,这个问题就容易得多。你要说数据分析在传统企业做不深入,没啥价值。那传统企业的品牌、推广部门更没价值,更浪费资源,人家屁股都坐的稳稳的,我们为什么不能坐稳。所以这里不要太纠结自己如何做的复杂,而是要找买家,找谁觉得我们有价值。
 
这里有六种找法,讲几种典型的:
1.皇帝密友型:如果老板经常看数据,能直接给总监以上级别的做汇报。就可以考虑争取老板认可,先打通这个关节;
2.神奇军师型:如果某条重要业务线对数据有需求,就可以抱大腿,大家组团立功。最常见的是从各分公司里找那些有想法,业绩中等,想往上冲,四处寻求支持的人。
3.大内总管型:规范流程,不接滥接零散需求,拿关键部门需求去打压边缘部门需求,制造数据的短缺感,然后定期把零散需求汇总上项目,上系统。
其他类型可以戳:https://edu.hellobi.com/course/194
里边很详细的
 
要记得一点,无论采取哪种方式,目标都是获取信任,或者是大老板的信任,或者是业务部门某条腿的信任。之后的目标就很清晰了:要人,要钱,要地盘。争取一些可能上项目。给自己的团队加人,加项目费用,做独立的系统不要和其他IT系统搅合到一起。团队做大了,自然自己的等级和收入就上去了。至于其他人觉得我们重不重要,随他去吧。
 
 
再具体的可以看看上边的链接,讲的很详细的。
 
其实在传统企业干不止数据分析,除了销售以外所有的后台部门都有这个问题:信任、人、钱、地盘。只不过是传统意义上,市场部都比较强势,销售部/业务部都是大腿,营运虽然苦逼但是必不可少,所以他们的地盘相对固定。传统企业的数据分析大部分是从市场部或者IT部脱胎出来,需要给自己挣地盘,不然永远是边缘角色。
 
像我们这种从遥远的2006年,从传统企业滚过来的分析老头子,看这些政治问题会比较通透。最后想上位,一定是在说官话(项目背景)立牌坊(项目目标)打地基(扩大项目组规模)吹牛逼(拉上大腿一起汇报项目成果)上花功夫。一些新人受了互联网思维熏陶,觉得上个阿尔法猫系统就能有地位了,就和小媳妇老被欺负,想生个儿子就不被欺负了一样幼稚,哈哈
数据分析师,可能乍一看就是一个工作岗位,但其实不然,它也有很多细分和要求,

1、数据分析师主要技能要求:数据库知识(SQL至少要熟悉)、基本的统计分析知识、EXCEL要相当熟悉,对SPSS或SAS有一定的了解,当然也有R语言和Python,绝对是加分项,对于... 显示全部 »
数据分析师,可能乍一看就是一个工作岗位,但其实不然,它也有很多细分和要求,

1、数据分析师主要技能要求:数据库知识(SQL至少要熟悉)、基本的统计分析知识、EXCEL要相当熟悉,对SPSS或SAS有一定的了解,当然也有R语言和Python,绝对是加分项,对于与网站相关的业务还可能要求掌握GA等网站分析工具,当然PPT也是必备的。

2、数据挖掘工程师主要技能要求:

1)数据库必须精通。很多时候,你模型的数据预处理,可能完成在数据库里完成,你用到的数据库技巧更高。

2)必须要会成熟的数据挖掘工具、数据挖掘算法,例如:SPSS/CELEMENTINE、SAS/EM等,当然如果你会一、二款开源软件,并会写一些程序代码那是最好的,大公司都喜欢用开源的软件,例如:R、WEKA。

3、数据建模师这不同公司对数据分析师的职位划分稍有不同,在一些中小型企业,没有成立独立的数据中心前,数据分析的相关职位往往是在譬如市场部、运营部这些部门之下,通常数据分析成员在2-4人不等。对于一些大型企业,有独立的数据部门的企业,其数据分析团队人员则是十到百人不等,其职位头衔有通俗的总监、经理、主管划分,也有助理、资深、专家之类的划分。

数据分析师有哪些工作职责?

1、负责项目的需求调研、数据分析、商业分析和数据挖掘模型等,通过对用户的行为进行分析了解用户的需求;

2、参与业务部门临时数据分析需求的调研、分析及实现;

3、参与数据挖掘模型的构建、维护、部署和评估;

4、整理编写商业数据分析报告,及时发现和分析其中隐含的变化和问题,为业务发展提供决策支持;

5、派驻或对口支持业务部门提供数据分析服务,与业务部门合作开展业务专题分析;

6、支持微博事业部等产品部门下的运营,产品,研发,市场销售等各方面的数据分析,处理和研究的工作需求。
出现这个问题的原因 可能是因为你取回来的数据与你当前脚本中声明的编码不一致,
import sys 
reload(sys)
sys.setdefaultencoding( "utf-8" )
我遇到这种问题一般就是导入sys
或... 显示全部 »
出现这个问题的原因 可能是因为你取回来的数据与你当前脚本中声明的编码不一致,
import sys 
reload(sys)
sys.setdefaultencoding( "utf-8" )
我遇到这种问题一般就是导入sys
或者在编码转换时首先要将你拿的数据以自身编码的格式换成unicode码,再将这个unicode按utf8编码试试
 

 
感觉没见过这个设置,不知道可行否,感觉是不可以的
感觉没见过这个设置,不知道可行否,感觉是不可以的
seng

seng 回答了问题 • 2017-11-26 15:36 • 1 个回复 不感兴趣

BIEE里数值类型转字符串怎么处理的?

赞同来自:

用 cast(int as char)函数看看
用 cast(int as char)函数看看
我也是小白,你学的这些对我来说好高深啊,如果是我的话,数据收集我会用R来爬网络数据(会python的话更简单吧),然后进行数据Excel或者R进行数据清洗,看自己的数据类型想要什么,然后直接套R里面的回归或者决策或者神经网络就可以了。要是机器学习过程会更复杂吧... 显示全部 »
我也是小白,你学的这些对我来说好高深啊,如果是我的话,数据收集我会用R来爬网络数据(会python的话更简单吧),然后进行数据Excel或者R进行数据清洗,看自己的数据类型想要什么,然后直接套R里面的回归或者决策或者神经网络就可以了。要是机器学习过程会更复杂吧~加油啊o(* ̄︶ ̄*)o
讲一个不懂编程也能入门的路线。

说到超级菜鸟:女生,二本,市场营销专业,别说vlookup连sum是啥都不知道,代码一个字母都不会,平时工作连电脑都不咋敲,这个应该够超级菜了。(确实是个小姐姐,没有性别歧视的意思哈)。唯一的优势就是颜值还行。小姐姐毕业后去了... 显示全部 »
讲一个不懂编程也能入门的路线。

说到超级菜鸟:女生,二本,市场营销专业,别说vlookup连sum是啥都不知道,代码一个字母都不会,平时工作连电脑都不咋敲,这个应该够超级菜了。(确实是个小姐姐,没有性别歧视的意思哈)。唯一的优势就是颜值还行。小姐姐毕业后去了某个银行信用卡中心做业务员。某段时候我在做银行项目,广泛体验各个银行的信用卡,于是就这么机缘巧合的认识了。100%出于想了解银行发卡模式,而不是被小姐姐颜值吸引的原因,我很认真的和她聊了平时的工作情况。得知这个小姐姐业绩非常的好,团队Ace,每月激活卡100张以上,个人收入估算接2w以上了。


有意思的是,小姐姐对我的工作也很感兴趣。她问我:“如何能转行到后台做工作?”我很惊讶,为什么收入这么好还想转数据分析呢?不觉得没钱途吗?要知道很多号称“数据分析师”都没有一年25万的。小姐姐表示:因为跑业务太辛苦了,风吹日晒,而且一天不做一天没收入,这日子没法过下去了。“还是你们后台好,对着电脑敲敲就有钱拿,为啥不做”。100%出于分享知识的考虑,我和小姐姐做了深度沟通。发现对于已经工作的同学而言,转行有着至少三大难关。


第一,曰:没精力。作为一个Ace销售,小姐姐性格非常独立坚强。想要她放下工作,关门谢客,再交上几万块培训费去读个培训班是非常不现实的。人家已经习惯了照顾家人而不是被人照顾。而且处于工作敏感性,她也不信任那些培训机构的销售:“还交一万九年薪五十万就业,他自己怎么不交一万九还在这卖课?”好吧,这个逻辑简直无懈可击


第二,曰:没基础。我也试着向小姐姐介绍sas,不过真的是一个字都看不懂。“我在学校都没搞懂,现在咋可能搞懂”好吧,又是一个无懈可击的逻辑。那试着介绍一下spss吧,可视化戳戳戳总行了吧。结果发现光安装就卡了好久。而且一点统计基础都没有的话,也不知道戳出来是个啥。

第三,曰:没记性。我转了一些文章让小姐姐看,基本上前脚看后脚忘。因为工作中用不到。实际上,我自己也有这种感觉。工作中用不到的东西,即使对着学了忘的也特别快。因为平时不用啊,就靠对着课本练,脱离书就是个呆子。


咋办?我认真思考了问题的关键:如果能找到一个工作中就能用到的例子开始训练就好了。真是完全没有基础的话,一上来就列一堆信息、公式、概念只会把人绕晕。如果能找个简单的方法让她理解到:什么是数据、什么是分析,后续如何做数据分析就是水到渠成的事。刚好我当时正在做相关的项目,优秀的销售和死蠢的销售都接触过,这一点极大的启发了我后来的思路。

我试着启发小姐姐的思路,从一个简单的问题开始:什么样的顾客容易成功?小姐姐瞬间打开了话匣子,列举一堆例子。OK,这里先不急着讲完所有故事,我拿出了银行信用卡申请表,问道:假设把刚才故事里的顾客特征对应到表上需要填的这些空格,该如何填?小姐姐愣了一下,然后开始笑话这些申请表能记录的信息太少,很多信息需要销售直观判断。OK,我继续引导:所以这里就有两类信息:一类容易记录的、客观的、格式化的数据,一类难记录的、主观的、个性化的数据。然而,后台的工作人员远在千里之外,他们无法直面顾客,他们只能通过能记录的数据来判断,考虑做什么样的政策,出什么样产品。所以,如果你真想转到后台去的话,你就得想办法:要么从现有的有限的数据中得出结论,要么把主观的数据合理记录下来。


小姐姐似乎想到了什么,然后开始说:那样的话,这里哪几个字段可能最有用处,这里哪些字段其实都是销售们瞎填的。如果真需要添加的话,能不能添加1,2,3,4个维度,而且为了防止一线的销售们瞎搞,还可以配合比如工牌照片、人车合照等等办法。我们边聊,边拿出一张值,把可以用的、有问题的、需要添加的字段都记录下来,并且标上数据格式,填写规范等等。完成以后,我开始介绍:这就是后台部门面临的数据库的简单样式,有字段、字段属性、数据来源、数据真实性、数据清理等等等问题。小姐姐似乎一下恍然大悟,这样讲比一上来讲什么数据仓储容易理解多了。

于是我趁胜追击,开始引导一下阶段问题:你看,你一个月能做100多张卡,有没有计算过办哪些卡,总收入更高?(不同信用卡对应的提成,是否伴随贷款,是否开自动还款业务都会影响提成收入)。小姐姐开始认真考虑不同产品组合下自己的收入。之前也有考虑过,但从没有认真计算过数据,都是自己粗略估算或者听营销中心的日报。有了之前的基础,我们开始分解日报。利用一张最基础的含用户、卡信息的excel表,开始试着做数据统计,计算收入。因为和收入有关,所以小姐姐计算起来格外起劲。并且数据透视表、求和、平均值、if等公式用几次就会了。

于是我趁胜追击*2,开始引导一下阶段问题:你看,这些卡片销售数据和顾客特征结合起来,是不是可以看出来哪些顾客容易办哪种卡?(不是所有的申请表都会被批准的,多多少少都会退一批,填写规范下,过审率一般六成左右)。小姐姐一下兴趣被调了起来,因为被退卡是一线销售非常深恶痛绝的事,因此我们继续拿基础excel表练习,这次是练习交叉表。开始交叉分类看用户特征,试着用不同维度交叉,看哪些类型用户更容易被pass。尝试几次后,竟然发现销售们日常总结的审批规律,有一些还真有道理,甚至还反推出一些审批的潜规则。

于是我趁胜追击*3,开始引导一下阶段问题:你看,你作为这么厉害的销售,肯定有些人会比你差。你和他们比,他们差在哪里。小姐姐又一下兴趣大开,讲了一堆很具体的行为差异。OK,我们回归一下,把这些具体事件中的可以用数据量化的部分截取出来,把那些不能用数据量化的部分,看看是否能有字段记录。这样再归纳以后,就找出来衡量销售行为的基本指标,进而导出了分析团队业绩的基本思路。(实际上,我直接分享了部分项目结论给她。自己解读数据是个很好的尝试思路,但是一个0基础自学者,自己总结结论还是太难了)。

完成这几步以后,小姐姐已经基本具备了数据分析的初级能力,还差临门一脚:简历要怎么投?因为数据分析范围实在太宽泛了,即使做了训练,以小姐姐的能力投开发类岗位也实在是天方夜谭。好在银行里各个分行、营销中心都有数据专员的岗位,这些岗位主要任务就是做销售数据分解和解读,小姐姐的能力非常适合。最后临门一脚,帮小姐姐包装一下简历,一顿饭的功夫,突出一下在分析问题上的经验和能力,之后便一投即中。虽然薪资降低了不少,但是还是如愿做了不用风吹日晒的后台工作。


后来,听说小姐姐嫁了人。俺也在太太的监督下,清空了所有这种100%出于学习分享目的讲过一大堆话的小姐姐的联系方式。后续的情况不得而知。但这确实是我指导过的,最有挑战性、最0基础、也最快速实现转行的例子了。前后用了没俩月。回想起来,小姐姐虽然数学和代码基础差,但有几个优势:


第一,业务能力强。对业务流程非常熟悉,有丰富实战经验。这样很容易找出业务中的问题,就容易找到分析问题的思路,看到数据也容易明白含义。第二,思维逻辑性好。比如第一步总结顾客特征,她可以很快理解我的用意,把那些一个个具体的人,归纳成:39岁、小企业主、500万经营收入、本地人等等字段。数据分析是以字段为基础的,这一步如果理解不了,就真的深入不下去了。我也见过很多思维方式特别感性的人,就是卡在这一步,始终无法把一个具体事情抽象成一组数据,后边的分析也就无法基于数据进行了。他们更多是基于感情、直觉做判断,把数据分析的过程视为一个黑箱,等着听结论。第三,动手能力强。Excel操作几次就会了,没有耽搁很多时间反复练习。第四,公关能力强。营销中心、卡中心她认识不少人,直接拿到了内部一些数据表做练习,进步非常快。这个真的是用模拟数据无法比拟的优势了。

而我只是起到一个穿针引线的作用。找了一个好的切入点,吊起来她的兴趣,让她能坚持思考下去,而不是半途而废。或者装着一脑袋和工作完全不相关的东西,完全不知道学了有什么用。其实数据分析,是数据+分析组成的。技术上如何生成数据是一个切入点。业务上如何做分析也是一个切入点。能从问题出发的好处,就是能以始为终,很快找到思路。当然,这是以能理解数据字段、数据来源为前提的。


当然,这是极特别的个案,其实但凡有一些excel、sql基础,上路都不会这么艰难,也不需要那么强公关能力或者颜值什么的。即使看起来行业差的特别远,即使岗位看起来特别奇怪也没有关系。因为数据分析其实是职场的一项基本技能,在哪里都有用,在哪里都能练习。

比如我遇到过一个三线城市做拖拉机设计的男同学。他想转数据分析,但满眼望去,都是“互联网数据分析XXX”。感觉自己的工作跟数据分析,跟互联网很遥远。然而我不这么认为。我提示他:你做设计,也分创新设计和改良设计。如果改良,你要改哪些款?为什么选这些款?是销量不好,还是故障率高,还是用户口碑差?如果是销量不好,怎么判定好?数据从哪里来?标准怎么定?

拖拉机哥认真想想,忽然觉得恍然大悟:是哦!平时会走访市场,会看不同省市区的销量,还会看售后服务的数据,就是从来没认真思考过这些。平时工作都是拍脑袋,看着哪个月问题多了就做个市场走访,收集收集问题回来写报告,从来没认真思考过到底什么数据算好!这么一说还真的有挺多东西可以挖的!

我继续鼓励他:是滴,这就是一个项目了!因为有明确的目标:改良产品,有明确的时间限制。如果你再主动跟踪下,你们改良后的产品批次是否故障率下降,这就是成果。这就是标标准准的一个数据驱动产品迭代升级的例子。谁说传统企业没有数据思维了,只是大家都习以为常了。

还是拖拉机哥,在整理了思路后,觉得自己有信心了。但他想面试的互联网公司大部分都要求python,SQL一类经验,在现有岗位上确实没得练习。还是得练爬虫。我又提示他:做产品研发,你们肯定会参照竞品是不是?以前的竞品信息八成是手动更新的吧。你可以把爬虫技能拿来练习爬竞品产品信息啊,从官网上、从阿里巴巴,反正只要能找到信息的都可以爬。这些可是货真价实对你工作有用的呢,不比爬什么拉勾网管用。


拖拉机哥恍然大悟:是啊,这样还能显得利用爬虫提高了工作效率,还能进一步分析,自学的也与工作结合了。这个例子敢拿出来讲,当然是happy ending,拖拉机哥如愿离开内地三线城市到了魔都成为一名互联网数据分析师,薪酬翻了1.5倍。虽然在陈老师看来,他那个薪酬在三线城市不少了,但是人各有志,达到自己的目标就好。


类似的例子还有很多,比如财务的同学可以练习ROI分析、做经营分析;比如运维的同学可以练习项目开发资源管理的分析;比如做销售的同学可以练习目标客户与销量分析;比如做开发的同学至少接触过数据可视化。其实,数据早已渗透进工作方方面面,对转行的同学来说,最大的敌人是:“习以为常”四个字。太多的固定思维,导致对数据不敏感,导致分析能力下降。导致看不到自己工作中的数据应用,导致过份依赖网上所谓“干货”。然而收藏的东西固然多,买的书本固然厚,能看完吸收的又有多少?


写sql,python是一种技能,数据分析是一种能力。技能可以照抄,能力需要锻炼。不练,永远不会。与大家共勉。

更多分享,可关注公众号:接地气学堂
 
业务知识一站通,数据分析师的第一堂企业实战课
https://edu.hellobi.com/course/179
接地气学堂

接地气学堂 回答了问题 • 2018-01-12 13:45 • 1 个回复 不感兴趣

商业分析能力是怎样炼成的?

赞同来自:

作为一个从一线摸爬滚打上来的老兵,补充一些个人心得:

曾经数据分析师是一个被严重低估的岗位。在我12年前本科毕业的时候,做分析是件相当没前途的事。我本人读的是应用数学系。那时候一流的学生做金融,二流的去宝洁、IBM这种五百强,三流的进各大银行三大运营商的IT... 显示全部 »
作为一个从一线摸爬滚打上来的老兵,补充一些个人心得:

曾经数据分析师是一个被严重低估的岗位。在我12年前本科毕业的时候,做分析是件相当没前途的事。我本人读的是应用数学系。那时候一流的学生做金融,二流的去宝洁、IBM这种五百强,三流的进各大银行三大运营商的IT部,四流的做软件开发,不入流的人才去做什么数据分析。在那个年代,腾讯还是一个年收入30亿的小公司,百度刚刚崭露头角,阿里还不知道在哪里。华为,好像华为和数据没啥关系……

在这种大环境下,我果断的读了研究生。不争气的转了管理学。进入文科生的世界以后才发现,原来本科读个数学专业是这么霸气,想水个管理学/经济学的论文简直太easy。只需要找到一篇底稿,修改一下研究假设,派个问卷,然后几十行代码往lisrel里一丢,就基本大功告成。如果输出模型检验值通不过,还能通过数据加权,合成变量等手段合理合法的改数据,改到OK为止。以上做法虽然为正儿八经学习的同学们所不耻(确实很无耻,同学们勿学),但是却是应付差事的利器。类似的还有利用SPSS做因子、聚类分析,用Eviews做经济学模型,虽然过程经不起推敲,结果却看起来像那么回事。


那个年代还没有调参侠这个称呼,因此没有人当头棒喝给我那么一下,告诉我这种二半吊子做法会有什么危害。两年水来水去的生活,让我饱受同学们好评与老板们喜爱。于是不知天高地厚的,以为做分析真的就是模型一套数据一堆就搞掂了。在找实习的时候恰逢经济危机,甲方企业普遍缩减用人,于是找了个咨询公司试试伸手。没想到一试效果还行,很受领导同事的喜欢。就这么阴差阳错的绕了一个大圈以后,我又回归了数据分析的行列。

真正工作以后做的数据分析,和目前流行的数据分析基本是两个概念。确切的说,应该是更偏“分析”而不是数据。基础的数据整理、跑SQL、问卷统计等等并不需要我处理。一来当时有技术小哥帮我做这些事情,二来当时的任务是要面对客户老板。在2010左右,大企业的ERP系统已经很普遍,有条件的企业已经有了BI系统,他们所面临的问题,不是没有数据,而是没有结论。到底这些数说明了什么,到底我要怎么做,是最迫切需要回答的问题。


最初还没有自己负责项目的时候,还感觉这些东西很简单。如同所有咨询公司的同学一样,我也收藏了一套《麦肯锡七大手册》,SWOT,PEST,5w2h什么的背的滚瓜烂熟,没事就把杜邦分析法拉出来用过往项目数据撸一遍。感觉真的很简单yeah,从模版库捞ppt然后把数据往里填就好了。而且只是帮着别人撸报告,会觉得项目之间都很像。你看营销分析框架就是这一套,先诊断再找标杆最后出结论,换我我也会写。真不明白领导们在纠结什么。

出来混的,迟早是要还的。当我自己独立面对客户的时候,我终于明白领导们在纠结什么了:他们在纠结如何不被客户操死,活着把尾款收回来。因为寻找答案,比寻找数字难的多。客户花了几十上百万不是来听《管理统计》或者《市场营销》课的,而是结结实实的需要答案。到底数据背后说明了什么问题?到底这个数据能得出什么结论?我早知道这个情况了,你又分析了什么?是最常被提起的三个问题。而且,相信我,没有一本书能告诉你答案。请务必相信我,因为我真!的!试!过!

“我知道销售在这几天少了30%,所以又怎么样?”“模型预计增长30%,所以我只要坐着不动听模型的就对不对?所以我的销售要干什么?”“寻找高端客群,说的容易,我到哪里找?我要找多少?光找高端就够吗?”客户类似的咆哮,如同春节的鞭炮,在我耳边噼里啪啦啪啦霹雳炸的不停。以至于养成了一个习惯:但凡有新人写报告的时候附上:“我们一要提升销售连带率,二要优化产品品类”这种结论,我都会把这些爆竹拉出来再点一次,炸的新人魂飞破散为止。

当我很困惑的时候,我的领导用一种最简单的方式破开了我的困惑。某天在街边吃饭,他指着对面桌某个正在吃饭的小哥,说:“你注意到没有,他是我们某个客户的业务员,你现在告诉我,你可以怎样帮到他做业务”。我愣了半天,完全想不到该做什么。话说,要是我会做销售早就去做了好吧,为什么还要在这做分析写报告啊!我就是没有能力死皮赖脸的求人买东西啊。我只会找自己的熟人啊,介绍产品也含羞带臊啊。而且,这种基层业务员的动作,和数据有什么关系?我们分析的不是销售额,客单价,转化率这种抽象的东西吗?我们的分析和具体的业务离得很远啊。具体到一个个销售动作?有没有一个监控探头24小时拍摄业务员动作,数据都没有,分析个啥?

领导说:“这就是问题的关键了。你没有能力帮助基层的业务员,你怎么有能力帮助他的老板?他的老板下边有无数的这种人要管,他要烦的事本质上还得通过这些人搞掂。你不能帮助这些人做出业绩,你凭什么认为你能帮助他的老板搞掂业绩问题”。这一刻,我突然明白了为什么数据分析在企业内不被重视。

因为值钱的是数据,不是数据分析。比如对面的业务员小王,如果你能马上给他500个对我们产品感兴趣的顾客电话,那他怎么着也能把业绩做出来。如果你只是给500个电话,他还得辛辛苦苦打上一天,看有没有机会碰到一个订单。如果你给的只是:“我们的目标客户是年薪30-35岁,年收入2万以上喜欢在高端商城逛街女性”他估计能气到吐血,这他妈都是什么?你是让我去商城门口拦人吗?会被保安痛扁的好吧。如果有优质的数据,比如银行,可以拿到用户真实的个人信息,资产情况,通过银行卡记录用户消费情况,那么即使没有什么复杂的模型,也能轻松判断用户价值和需求。如果像大部分传统零售快消耐用企业那样,只有少量订单数据,就只能做一些不接地气的经营分析。对基层而言,有用的从来都是数据,而不是分析。

决定我职业发展的重大时刻,在这里来到了。我反问了领导一个问题:是滴,我是不会教小王,可是如果我能用数据追踪到一个优秀的业务员,让他去教呢?领导笑笑说:“你小子终于开窍了”。然而这个窍依然开的很艰难。当我真的在这个项目里找到了销售团队Ace以后,发现这他妈的根本复制不了。因为那哥们不是一个人,而是一个“人精”。无论外貌、着装、言语、谈吐、思维速度,根本不是一般人可以比的。而我既不能建议客户把剩下的200个销售都炒了换成这种人精,又不能建议销售们集体再投一次胎。感觉这标杆树的跟数据分析没什么关系,应该归入《投胎学》范畴。

这时候再经过领导提示,我才真正理解了流程梳理的含义。梳理销售流程不是简单的列4个P然后填做填空题,而是真正深入到业务当中。观察每一步细节。到底这个行业销售过程分作几步?最原始的名单从哪里来?工作计划如何安排?拜访客户时间表怎么定?FAB先怎么讲后怎么讲?不同类的客户是否有区别?如何探测需求成熟度?多少天、多少频次、什么理由、什么形式做跟进?最后投标价格如何比拼?一步步,一个个细节去理解销售场景,去观摩业务员行为。去剥茧抽丝,哪些是所有人可以执行的,哪些是个人特性的;哪些是可以量化的,哪些是主观能动的;哪些需要系统工具,哪些需要人工考核。

详细的梳理之后,有限收集的数据和无限复杂的业务场景结合起来,数字忽然变得有意义。这个时候开始理解为什么一个行业销售数据会有自己的波动形态;才开始理解为什么在这个行业中销售波动5%不是问题,波动10%就是问题;才开始理解为什么客户看到A类用户75%流失率也不为所动,看到B类用户10%流失率就开始发飙。虽然这样理解以后只能和客户对行业的认识打个平手,但是客户往往没有系统全面的看过数据,只有零散的凭经验的认识。逻辑性+行业理解,可以让顾问赢得客户的认可,至少能和客户平等的探讨问题,而不是被人呼来喝去了。

之后就是无数的项目积累,接触的行业越来越多,被操的次数越来越多,能力也成长了很多。到现在我都坚信:好的数据分析师都是被操出来的。被人反复质疑:你这个数据说明了什么?看到数据又能做什么?我早知道了,你又分析了什么?这三大问题以后,就会越来越思考数据分析的价值,就会越来越聚焦于分析的意义,就会抛弃那些刻板的公式与理论,找到真正对企业经营有意义的分析结论。这些才是客户愿意花钱买的东西。“如果只是看数,人家的BI系统早就有数了,为什么要花钱找你们这些人”每次培训,我都会这样给新兵们强调。

But,题目是《一个优秀的商业分析师》,所以到底优秀体现在什么地方呢?在我看来,优秀就是赚钱。如果做科研的话早就读博去了,我们出来打工就是为了赚钱,对不对。赚到钱的才算优秀。而在这一点上,陈老师有一点小小的心得可以分享。就是当我开始和销售一起打标的时候,我得到了第二次分析能力突飞猛进的机会。

这个机会叫弄死竞争对手。因为我只是广大乙方公司中很普通的一员。每次客户招标可能要看几份甚至十几份详细的方案。对面也是电脑E盘工作资料文件夹里收藏了几十G ppt的小哥小姐姐,怎么能脱颖而出呢?某次我去打标,做的方案太四平八稳,被客户吐槽:“你们分析都是这些套路,有什么新意思吗?”我很不服气,回来的路上一路吐槽:“净TMD扯淡,我TM就不信他TM能找到更TM厉害的,做市场进入研究不就TM这个套路其他公司还TM能玩出花来”。骂完之后我忽然有个想法:为什么不把这些常见套路直接展示给客户呢?我还就不信了谁还能比谁强多少。

某次客户初步和我们沟通意向,只是抛了个很常规的新品研究与上市策略的需求。眼看着又要被人吐槽:老一套。我主动出击了:“通常市场研究公司或者咨询公司都会先看目标群体再看市场份额最后做竞争态势。输出到您面前的一个条形图,您的对手bar大概这么长,您的大概这么长。然而我们早知道了啊。这个领域我们两家独大,且我们落后于竞争对手,这是个基本事实。我们的用户画像,即使没有明确的数据大家心里也八九不离十。与其花大力气重复这个事实,不如提炼出发展新用户的逻辑。这样就能真正找到切入市场的办法”。

我边说边在白板上画出图表的形态。我看到客户那边手下小弟很认真的看着我画的然后微微一笑,我看到领导表情很沉重如有所思,我知道这鱼基本上上钩了,他们应该看过类似的报告,而我正在赢得这场游戏。领导听完愣了一下,缓缓的说:“那你的建议呢?”我知道我的机会来了。我坚定的说:“既然明知道处于下风,就不要分散投入。我可以在完成基础画像完成后,快速切入竞争胜利与失败的用户群体,把更多项目费用用在测试竞争效果上,这样后续落地建议将更具体和有效”。客户领导认可的点了下头。当天晚上就发了中标通知。这是我第一次用竞争分析法搞掂客户。

之后我便更常使用这个方法。当然,之后应用的更灵活,没有那么激进的直接抨击对手(因为发现太过直接的抨击别人,会显得自己太过高调,会引起客户反感)。而是站在客户的角度思考:“到底这样做有什么用”。当我自己把自己当成评标委员,自己怼自己一顿以后,差不多如何打赢竞争对手的思路也差不多有了。

当然,赢得客户靠的不止有专业性,还有关系、费用、品牌大小等等,陈老师也并非一路战无不胜。但是这种自我diss,站在需求方角度看问题的思维方式,使得我至少超过了平均水平。即使没有赢下单子,客户至少认可我的个人能力。直到脂肪肝把我赶离咨询行业以前,我都能保持很好的工作状态。

最后总结一下,一个优秀的商业分析师是如何炼成的:第一,摆正位置,从理解如何做生意开始,理解商业问题;第二,理清流程,了解商业过程的完整流程;第三,探索规律,从优秀/差劲案例中总结商业经验;第四,提炼假设,总结出可以定性/定量分析的维度;第五,总结经验,从具体的问题分析中总结出适用于一个行业,一个企业的经验;第六,挑战经验,不断反问自己,除了这些经验以外还有没可能性,还有没有更多办法。这六个过程不断迭代,最后自己会在梳理问题逻辑,理解行业运作上越来越深入,自然也越来越优秀。

本质上,商业分析为的是解决商业问题,商业问题是盈亏利损,不是加减乘除。能理解商业运作本质,具体问题具体分析,才是商业分析师真正该做的事。把《管理统计》和《市场营销》两本书订在一起,只是证明一个人手劲很大而已。与大家共勉。

更多个人分享,可以关注公众号:接地气学堂
新旧版本的替换,参考 openpyxl文档
 新版本的get_column_letter()和column_indwx_from_string()位置发生了改变,在openpyxl.utils下 from openpyxl.utils import get_... 显示全部 »
新旧版本的替换,参考 openpyxl文档
 新版本的get_column_letter()和column_indwx_from_string()位置发生了改变,在openpyxl.utils下 from openpyxl.utils import get_column_letter
from openpyxl.utils import column_index_from_string 这样引入是可以正常使用的
0
推荐
228
浏览

淘宝童装市场儿童内衣裤子类目市场分析简报·第十九期

    本篇分析报告主要是针对淘宝市场2018年儿童内衣裤类目在春季的热卖属性进行分析,消费者人群的基本特征以及洞察消费者在给宝宝购买内衣裤时更关注哪方面的信息,围绕这三个方面的内容进行详细...

零一老师 发表了文章 • 2018-01-25 09:55

3
推荐
790
浏览

《人人都会数据分析》20万字电子版

去年的时间把之前的数据分析工作经历、大环境背景、职场选择、公司选择、岗位选择、统计学的基本常识、需要掌握的分析工具、怎么写好一个报告、互联网和金融行业的分析场景这些都整理了下。具体购买链接:https:/...

面包君 发表了文章 • 2018-01-03 15:15

5
推荐
556
浏览

《R的极客理想》系列图书作者张丹:用R语言把数据玩出花样

前言作为数据分析师,每天都有大量的数据需要处理,我们会根据业务的要求做各种复杂的报表,包括了分组、排序、过滤、转置、差分、填充、移动、合并、分裂、分布、去重、找重、填充 等等的操作。有时为了计算一个...

R语言中文社区 发表了文章 • 2017-09-28 09:59

4
推荐
805
浏览

Python简介

什么是Python Python是一种解释型的、 面向对象的带有动态语义的高级程序设计语言Python的诞生第1个Python编译器/解释器于1991年诞生 Python名称来自Guido挚爱的电视剧Monty Python's Flying Circ...

· 发表了文章 • 2017-09-19 10:26

7
推荐
924
浏览

拉勾网数据分析岗数据分析

简介:试着,做了一个拉勾网数据分析师职位的数据分析。其实,虽然很想做数据分析师,但是是跨行,心里相当忐忑,做这个分析就相当于加深自己对数据分析这个行业的了解了。思路大致思路起始数据来源本来是想自己...

wangtianshan 发表了文章 • 2017-08-23 12:51

7
推荐
955
浏览

我爬了某宝上4000+网店只为了告诉你中国人最爱喝什么绿茶

作者:吴人链接:http://blog.csdn.net/liu_sn/article/details/72567476微信:1521172694求实习:本人明年3月份浙大硕士毕业,想找一份今年暑期的实习,若能推荐,不胜感激!著作权归作者所有。商业转载请联系作...

吴人beng越 发表了文章 • 2017-05-20 18:37

18
推荐
1767
浏览

为啥214被塞狗粮的单身汪,520还会被塞狗粮

马上就是520,又是一大波狗粮即将来袭,又是一片单身汪呼天抢地,又是一批《为什么优秀的男生都不追女生》这种直男癌YY文开始传播。套路如此熟悉,结果却依然相同:该单身的还在单身啊!到底是什么阻碍了单身汪们...

陈老师 发表了文章 • 2017-05-19 16:28

1
推荐
750
浏览

数据分析,R还是Python?真的是个问题么?

R和Python作为数据分析的两大主流语言,究竟哪一个更好的争论不绝于耳。但对于两个语言都了解尝试过的小伙伴而言,结论其实非常简单:都好但都有不好。下面从几个方面聊聊我的看法。开发目的据我近期的观察了解,...

张土豆 发表了文章 • 2017-05-17 18:05

10
推荐
1359
浏览

数据分析师VS算命先生,除了算盘与键盘,还有啥差别?

想了解自己数据分析能力到了哪一层,戳{数据分析6个能力等级}想和大牛学更多思维方式,戳{和管理咨询顾问学思考}我们到底是在做预测还是算命 无论从各个层次,各个维度看,数据分析师和算命先生都有天渊之别...

陈老师 发表了文章 • 2017-05-16 16:32

1
推荐
714
浏览

【数据分析】员工奖金合理性分析

分析目的:根据20**年以来的奖金分配数据分析分公司员工奖金分配是否合理。分析结果:按月份不分分公司,从整体数据来看经理奖金与人均奖金符合y=2.2308x-308.81,且拟合度达到了0.981,即98.1%的数据符合两者的关...

w卫东 发表了文章 • 2017-05-12 17:47

8
推荐
988
浏览

数据分析师该这样霸气回应“0.00008的转化也很好”的谬论

活动做的好不好,到底谁说了算? “花费300万成本做促销推广,买了一堆KOL,淘宝广告,微博刷屏,最后转化率0.00008,也是极其成功的活动,原因有三:”“第一,花钱做社交媒体就是没转化的,这是常识”“第二,...

陈老师 发表了文章 • 2017-05-12 16:26

7
推荐
1547
浏览

分析报告被嫌弃没重点。怎么办?看这里

想了解自己数据分析能力到了哪一层,戳{数据分析6个能力等级}想和大牛学更多思维方式,戳{和管理咨询顾问学思考}数据驱动决策?还是被人嫌弃? 数据驱动决策?说的好听,有几次老板决策是听数据分析师的。实...

陈老师 发表了文章 • 2017-04-27 12:07

11
推荐
1320
浏览

精准营销大扫盲。破除模型迷信人人有责,有利你我他

其实最智能的精准营销模型叫亲妈,其次是迷魂汤 阿尔法狗化名master挑翻一众高手,引爆了人们对人工智能和算法的关注,也使得数据模型与算法再次成为热点话题。在各路自媒体大肆宣传下,似乎通过算法就可以...

陈老师 发表了文章 • 2017-04-21 15:33

3
推荐
1244
浏览

数据分析技术:信度与效度分析;信度和效度不仅仅能用于问卷分析!

20170418的微课《玩透信度与效度》已经在上完了,下面是微课介绍的部分内容。课后大家踊跃的提问,也给了我很多的课程改进思路,谢谢大家的踊跃参与!什么是信度和效度?信度代表的是数据的可靠性程度和一致性程...

老谢 发表了文章 • 2017-04-20 11:08

6
推荐
918
浏览

案例+课件下载|34页PPT,手把手教你做文本挖掘【资料放送】

1、本文是4月20日手把手教你做文本挖掘的课件;2、4月20日 20:30 Sim老师主讲《手把手教你做文本挖掘》直播地址:​https://edu.hellobi.com/course/117/lessons  (友情提醒:打开就可以看,建议P...

天善智能 发表了文章 • 2017-04-19 15:58

0
投票
1
回答
63
浏览

各位大神 小女子求帮助

许胜利 回复了问题 • 2018-05-16 09:17
0
投票
0
回答
70
浏览

SSAS 如何连接PostgreSQL数据库

zmhhit 发起了问题 • 2018-05-09 10:50
0
投票
0
回答
77
浏览
0
投票
0
回答
78
浏览
0
投票
0
回答
78
浏览
0
投票
0
回答
106
浏览

python numpy

Keda_PPW 发起了问题 • 2018-03-21 16:28
0
投票
2
回答
131
浏览
0
推荐
15
浏览

2018年 九大改变世界的技术趋势

技术的世界正在爆炸式发展,“日新月异”不再是一个修辞,而是正在发生的现实。在这其中,有一些发展趋势注定要改变世界,改变我们的生活方式。在此,我们借鉴美国大数据专家Bernard Marr的观点,为大家介绍2018...

数据观 发表了文章 • 7 小时前

0
推荐
15
浏览

一元(多元)线性回归分析之Excel实现

作者简介okajun个人博客:https://ask.hellobi.com/blog/okajun工作中最常用、最简单的估计就是一元(多元)线性回归分析了,比如预测销量等,今天来分享一下Excel的实现方法。1. 一元线性回归先说一元:使用R语...

R语言中文社区 发表了文章 • 8 小时前

1
推荐
17
浏览

为jupyter_notebook增加目录

前言jupyter_notebook是数据相关岗位从业者的一个不错的选择,很清晰、很方便,可以将分析过程和分析结果同步显示在一起。但是有的时候随着你的分析增多,你的代码就会变得很长,这个时候就需要目录这样的功能,...

张俊红 发表了文章 • 13 小时前

0
推荐
37
浏览

R语言实现统计分析——非参数假设检验

作者:糖甜甜甜 公众号:经管人学数据分析往期回顾:词云一分钟了解周董的歌词非参数检验是指总体不服从正态分布,且分布情况不明时,用来检验数据是否来自同一个总体假设等一类检验方法。非参数检验通常是...

R语言中文社区 发表了文章 • 1 天前

0
推荐
49
浏览

小微企业的福音,大道至简的办公化BI

请点击此处输入图片描述还记得上次小麦跟大家聊的SaaS BI吗?详情见文章《无需浏览器 ,这样的SaaS BI,你喜欢吗?》,小微企业等轻量级BI用户一直被商业智能BI应用所“排挤”,硬件环境跟不上、人才跟不上,想想真...

大麦 发表了文章 • 1 天前

1
推荐
41
浏览

五个步骤,搭建企业的“大数据视野”

大数据时代,大多数企业都对大数据寄予厚望。通过数据分析,企业既能够实现危机预警,也能做到洞察先机。但是,企业规模不同、数据应用的成熟度不同,大数据技术的发展更是一日千里。俗话说,“一口气吃不成胖...

数据观 发表了文章 • 2 天前

1
推荐
62
浏览

词云一分钟了解周董的歌词

作者简介糖甜甜甜,R语言中文社区专栏作者公众号:经管人学数据分析前段时间周董发布了一首新歌《不爱我就拉倒》被网友吐槽土味十足,这段时间有本科同学让我帮忙做词云,所以借此机会把代码记录下了,顺便借周董...

R语言中文社区 发表了文章 • 2 天前

2
推荐
38
浏览

R语言绘制条形图

条形图可以通过垂直或水平的条形展示类别型变量的分布。熟悉R语言的用户应该都可以熟练的绘制条形图,但在实际应用中,我们常常会根据数据展示的需求对条形图进行调整,这就需要我们花费大量时间了解条形图绘制函...

R语言中文社区 发表了文章 • 5 天前

0
推荐
83
浏览

数据可视化助你提早发现设备存在的隐患

来自:数据观 https://www.shujuguan.cn/?from=tszn 设备正常运行是保证正常生产的前提。尽管现在的物联网、安全生产预警系统等先进设备已经能够帮助企业快速发现问题并提供成熟的解决方案,但是,我国的许多企...

数据观 发表了文章 • 6 天前

1
推荐
42
浏览

Sklearn参数详解—LR模型

最近开始一个新的系列,sklearn库中各模型的参数解释,本篇主要讲述最基础的LR模型。模型参数详解逻辑回归:sklearn.linear_model.LogisticRegression(penalty='l2', dual=False,         to...

张俊红 发表了文章 • 6 天前

2
推荐
159
浏览

Sklearn参数详解--决策树

前言先来简短的回顾一下决策树原理:决策树学习的算法通常是一个递归地(根据某一准则,信息增益或基尼系数)选择最优切分点/特征,并根据该特征对训练数据集进行分割,使得对各个子数据集有一个最好的分类过程,...

张俊红 发表了文章 • 2018-05-15 18:00

0
推荐
130
浏览

商业分析时髦范|作为HR,不可不学的“员工旅程分析”

来自:数据观 https://www.shujuguan.cn/?from=tszn [摘要]: 如果说“客户成功”是企业成功的外部基础,那么“员工成功”就是企业成功的内在基石。自2015年Airbnb任命“员工体验全球负责人”后,截至今天,领英上...

数据观 发表了文章 • 2018-05-15 17:52

0
推荐
177
浏览

统计挖掘的一些事一些情(一)

浩彬老撕,R语言中文社区特邀作者。个人公众号:探数寻理在这里首先要感谢苍天,感谢亚里士多德,感谢维克托·迈尔·舍恩伯格,让“大数据”成为了年度热词,咱们统计学同仁终于体验了一把“农奴翻身做主人”!在这两千...

R语言中文社区 发表了文章 • 2018-05-15 17:09

6
推荐
530
浏览

七周数据分析师总结

《七周数据分析师》总结本文是通过对秦路的课程七周成为数据分析师进行整体总结与补充。可以通过本文,对数据分析师这个职业有个基本的了解课程详细资料请自行查询。第一周:数据分析思维1.核心数据分析思维结构...

无小意 发表了文章 • 2018-05-15 11:30

0
推荐
148
浏览

EXCEL难以做到的而数据观可以做到的事

来自:数据观 https://www.shujuguan.cn/?from=tszn在处理数据和分析数据方面,Excel往往是人们的首选。虽然Excel很强大,但是在某些方面,它也有些力所不能,下面我们就来看下,在高效办公时,那些Excel难以做到...

数据观 发表了文章 • 2018-05-14 17:22

  数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。