七周成为数据分析师-第四周可视化笔记

浏览: 3172

数据可视化

可视化的目的是让数据更高效

读者高效阅读,不单自己使用

突出数据背后的规律

突出重要的因素

最后才是美观

 

一个数字都没有的图表,未必不是数据可视化的成果。

在可视化之前,数据要有两个概念:维度度量

维度(Dimension):描述分析的角度和属性,分类数据。

时间、地理位置、产品类型等。

度量(Measure):具体的参考数值,数值数据。

元、销量、销售金额等。

 

原始数据通过

  • Excel的数据透视、
  • SQL的groupby
  • Python的pivot_table

可以获得其维度和度量(或称指标)

 

常见的初级图表类型

 

1.1、散点图

解释数据之间的规律。

维度:1+,作为颜色。

度量:2

001.png

(结合象限法)

 

1.2、气泡图

散点图的变种,引入了第三个度量作为气泡的大小。

维度:1+,作为颜色

度量:3,其中1个是气泡大小。

002.png


1.3、单轴散点图

维度作Y轴,更倾向于洞察数据在不同类别下的数据规律。

 维度:1+,Y轴

度量:2

 

可用于:

客户消费维度RFM模型、消费金额与其他维度如折扣、会员积分、会员距离等的关系,还有垂直领域消费维度如

  • 投资金额和投资次数的关系(金融)
  • 最近一次距今消费和使用次数(SaaS)

 

2.1、折线图

数据随时间变化的趋势。

维度不宜过多,不超过10条,最多7/8条。

 

维度:1+,可对比

度量:1+

时间维度:X轴

 

2.2、面积图

折线图的变种。

数据类别之间,随时间趋势的变化关系。

维度:1

度量:2

 

3.1、柱形图

类别之间的关系

维度:2

度量:1+

 

 

3.2、直方图

柱形图的统计型变种。

维度:0

度量:1

 003.png


3.3、正负比例柱形图

3.4、正负比例条形图

 004.png

3.5、堆积柱形图/百分比堆积柱形图

3.6、瀑布图

005.png

(甘特图)

 006.png

(甘特图2)

 

4.1、饼图

环状的柱形图,PPT用得比较多。

维度:1

度量:1

(南丁格尔玫瑰图)

007.png

(环形图)

 

5.1、漏斗图

对转化过程的直观展示,面向PPT。步骤不要超过7个。

维度:1

度量:1

 008.png

009.png

 

6.1、雷达图

适用于个体数据和属性可视化,比较偏描述性数据,常见于CRM、用户画像。

维度:1+

度量:1+

 

注:CRM(Customer Relationship Management)客户关系管理。定义:企业为提高核心竞争力,利用相应的信息技术以及互联网技术来协调企业与顾客间在销售、营销和服务上的交互,从而提升其管理方式,向客户提供创新式的个性化的客户交互和服务的过程。

其最终目标是吸引新客户、保留老客户以及将已有客户转为忠实客户,增加市场份额。

 

常见的高级图表

 

1.1、树形图

适合数据量较大的情况,尤其在类别较多的情况下。比如各类电商的SKU。

 

维度:1+

度量:1

 

注:SKU(Stock Keeping Unit),库存量单位,即库存进出计量的基本单元,可以是以件,盒,托盘等为单位。

SKU是对于大型连锁超市DC(配送中心)物流管理的一个必要的方法。现在已经被引申为产品统一编号的简称,每种产品均对应有唯一的SKU号。

单品:对一种商品而言,当其品牌、型号、配置、等级、花色、包装容量、单位、生产日期、保质期、用途、价格、产地等属性与其他商品存在不同时,可称为一个单品。

 

2.1、桑基图

桑基图是揭示数据复杂变化趋势的图表。

面积图是线性维度,桑基图可以一对多或者多对一。

维度:2,source,target

度量:1

 

3.1、热力图

数据在空间(地理空间、网页浏览)上的变化规律。

维度:2

度量:1

 

也可以是属性和维度的规律组合,比如变成星期表。

维度:1

度量:1

 

4.1、关系图  

展现不同类别之间的数据关系,常见于社交社会媒体。

维度:2 source、target

度量:0+

 

(以前在知乎上看见过一个分析大神爬取知乎大V的关注和粉丝,做成关系图,感觉非常有意思)

 

5.1、箱线图

统计用的图表,用来研究和贯彻数据分布,也能对比数据分布。

维度:1+

度量:1

(大学的时候,看研究生学长学姐做报告的图,大多要求箱线图)

 

6.1、标靶图(子弹图)

变种条形图,用于衡量业务销售完成情况。

 

维度:1+

度量:2

 010.png

(甘特图)

 

7.1、词云图

文本分析利器。PPT常客,卖弄大数据之必备图表。

维度:1

度量:0(??感觉度量是1吧,词的出现次数?)

 

8.1、地理图

数据和空间之间的关系。

既可以通过经纬度的数值度量绘制,也能通过省市的类别维度绘制。

维度:1(经纬、行政)

度量:1

 

Dashboard

  1. 主次分明
  2. 贴合场景
  3. 指标结构

Dashboard1.png

5~6个图表

右上角、最大,核心指标。

中等:二级指标

左下角、最小

 

 Dashboard2.png

Who 是谁在使用?

What 用户的目的是什么?

How 用户怎么使用?

 

后台监控,(满足二八法则,大部分没人看)

 Dashboard3.png

Dashboard4.png

不断更新


(笔记里涉及的图片都是跟着秦老师的视频,在excel里练习后做出来的。有一张气泡图,是考虑到一个问题:气泡图能不能底端对齐?看了一些讨论,自己试验出来的。总而言之,Excel也好,PowerBI也好,数据可视化入门很简单,但是要做得好,还要多加练习。)

推荐 1
本文由 莉莉安的向日葵 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册