川术

我将自己的所学,所想,凝聚在“川术”的只言片语中。自我成长的同时,若能给您也带来帮助,就是最大欣慰。

1
推荐
1956
阅读

分析师与运营协作的9个好习惯

最近两个月我将大量的精力放在了业务分析团队的组建和管理上。不断解决日常中遇到的协作问题,使我学到了一些分析技术以外的知识。由于人多事儿多,所以出现了不少很好的协作案例,值得推广一,分析师尽早介入业务。二,运营伙伴做好合理排期三,及时反馈。四,利用现有数据源解决问题许多时候,我们并不是缺乏数据,而...

发表了文章 • 2017-06-13 09:07 • 0 条评论

2
推荐
2095
阅读

快速认知数据的详细步骤(五)

“多维分析”是什么?许多许多年前,初次听到这么高大尚的名字,我确实不明觉厉。后来才发现,这是一种使用“数据透视表”就能实现的方法后,略感失望。但用多了之后,发现它真的非常强大。通过多维交叉来深入认知数据用大白话来举例子,你的体重,是一维数据;你过去30天每天的体重,是二维数据,因为增加了时间维度;你过...

发表了文章 • 2017-05-12 16:35 • 0 条评论

0
推荐
2908
阅读

你真的会用柱形图吗?

柱形图的概念已经形象的不需要再作说明了。竖起来放叫柱形图,横起来摆就是条形图,把柱子切割成几块就成了累加柱形图,切割出来的几块柱子用来表示各部分的百分比,就成了累加百分比柱形图。既然柱形图已经简单到妇孺皆知,百姓可用的地步,那为什么还要专门有一个章节来讲呢?难道它还有一些一般人不知道的特性或者用...

发表了文章 • 2017-05-12 16:20 • 0 条评论

0
推荐
1841
阅读

Excel中的散点图

平时见得最多的也许是柱形图了,但我个人最喜欢的却是散点图。在讲散点图之前,我先阐述一个不太严谨的个人观点。我认为,所有的数据图表都可以分为两类,一类是偏重于展示,一类是偏重于研究。如何理解?偏重于展示的图表,往往是将某个指标所蕴含的信息更为直观地表达,即该类图表中获取得的信息,是可以直接应用于业...

发表了文章 • 2017-05-12 15:51 • 0 条评论

2
推荐
1878
阅读

一位数据分析师的书单

随着最近新人的入职,发现自己之前给的书单过时了。更新一版,希望对大家有所帮助。统计学及机器学习入门《赤裸裸的统计学》《深入浅出统计学》《概率论与数理统计》(茆诗松)《机器学习》(周志华)数据分析技能《深入浅出数据分析》《Excel图表之道》《精益数据分析》《数据化决策》《R语言实战》《数据挖掘与R语言》...

发表了文章 • 2017-03-27 12:17 • 0 条评论

2
推荐
1582
阅读

5点帮助你优化调查问卷

线上问卷调查工具的不断普及,大大降低了调查的成本。我们在运营中,问卷调查的必要性是值得强调的。辛辛苦苦地从数据库中做挖掘做预测,很多时候不如一张问卷。问卷的题目设计,看似简单,但其实非常有讲究。我们很多小伙伴可能还意识不到自己出现的错误。本文的目的就是帮助大家避免一些低级错误。以下6点,不分先后,...

发表了文章 • 2017-02-16 13:38 • 0 条评论

2
推荐
1888
阅读

Excel使用的小经验(二)

现在越来越认识到:Excel非常强大,我却只用了它30%不到的功能。近来遇上过一些小问题,有幸当时提笔记下来了,稍作整理。计算时间间隔解决这个问题有两种方式:1.是如果计算的间隔是“年”、“月”和“日”使用DATEDIF()函数,该函数在Excel中是一个隐函数,在帮助文档里查不到,但直接能用,如下图注意:第二个参数位的日期...

发表了文章 • 2017-02-08 10:31 • 1 条评论

4
推荐
1808
阅读

数据驱动决策的13种思维

“数据驱动决策”,为了不让这句话成为空话,请先装备以下13种思想武器,相信将来你一定能用上!~第一、信度与效度思维这部分也许是全文最难理解的部分,但我觉得也最为重要。没有这个思维,决策者很有可能在数据中迷失。信度与效度的概念最早来源于调查分析,但现在我觉得可以引申到数据分析工作的各方面。**所谓信度,...

发表了文章 • 2017-02-08 10:26 • 1 条评论

3
推荐
1716
阅读

快速认知数据的详细步骤(四)

相关系数,一个在数据应用中极为普遍却极为容易用错的概念。有必要单独进行讨论。利用相关系数理解数据之间的关系传统的数据认知过程到“数据分布”这个环节就应该结束了。但我准备搬出自己的几个“土方法”,来让各位领略一下江湖偏方的效果。首先要说的就是相关系数。相关系数的计算公式你大可不必在意,只需要理解:相关...

发表了文章 • 2017-02-07 11:20 • 1 条评论

1
推荐
1921
阅读

快速认知数据的详细步骤(三)

初步认知数据分布拿到一个数据集,你先检查了数据源的质量,然后通过数据清洗提升了数据集的质量,再通过平均数的计算了解了数据集大小的一般水平,接着又通过方差和标准差了解了波动变化。经过这一系列的操作,你对数据有了一定的认知。但这就够了吗?答案是否定的。在数据的快速认知中,我们还需要对数据分布进行探索...

发表了文章 • 2017-02-07 11:19 • 0 条评论

1
推荐
2022
阅读

如何进行合理的运营测试?

我的运营策略是否有效?活动规则是否合理?这些问题抛给数据分析师,让他们从数据库中去扒信息回答你,其实是值得画问号的。最合理的方式就是做测试,或者说『对比实验』。通过测试中落下来的数据,才能形成合理的判断。撰写本文的目的在于,从最近我团队所尝试的若干个运营测试中,抽象出一套更普适的方法论,帮助大家...

发表了文章 • 2017-02-06 16:09 • 0 条评论

4
推荐
1542
阅读

快速认知数据的详细步骤(二)

读完上一篇的你,或许会觉得我说的内容太琐碎,太简单。那么进入第二步,许多和“数”相关的东西,就要在此展开了。必要的描述统计分析从审核数据源质量,到提升数据集质量,再到明确数据类型和单位,走完这三步,你就完成了数据清洗的过程。你是觉得被扒了层皮还是神清气爽?我的文字并不有趣,想必你一定相当疲累。那么...

发表了文章 • 2017-01-19 15:05 • 2 条评论

3
推荐
1681
阅读

快速认知数据的详细步骤(一)

当拿到一个数据集时,你通常会怎么做?你脑子里好不容易蹦出的那个答案正确吗?这个问题或许能让不少人尴尬。我们循序渐进地来回答这个问题。我们将遵循这样的顺序:数据源质量→数据类型→数据集质量→平均水平→数据分布→量变关系→多维交叉。通过这个系列的5篇内容,我希望你拿到任何数据集的时候都不蒙圈,都能有条不紊地...

发表了文章 • 2017-01-19 15:01 • 1 条评论

2
推荐
1552
阅读

5个提醒,让你远离“数据呆”

随着数据积累得越来越多,数据获取成本不断降低,人们开始走向另一个危险的极端,那就是任何事情都要看数据,任何决定都去依赖数据。这种风气培养出了越来越多的“数据呆”。作为一个数据分析师,我是非常反对“唯数据论”的。为什么呢?让我详细地来说一说。数据库并不能记录一切你觉得,通过数据库中的记录,你能够充分了...

发表了文章 • 2017-01-19 14:58 • 2 条评论

6
推荐
3010
阅读

我理解的朴素贝叶斯模型

我想说:“任何事件都是条件概率。”为什么呢?因为我认为,任何事件的发生都不是完全偶然的,它都会以其他事件的发生为基础。换句话说,条件概率就是在其他事件发生的基础上,某事件发生的概率。条件概率是朴素贝叶斯模型的基础。假设,你的川术公司正在面临着用户流失的压力。虽然,你能计算用户整体流失的概率(流失用...

发表了文章 • 2017-01-18 09:28 • 4 条评论