数据可视化
可视化的目的是让数据更高效
读者高效阅读,不单自己使用
突出数据背后的规律
突出重要的因素
最后才是美观
一个数字都没有的图表,未必不是数据可视化的成果。
在可视化之前,数据要有两个概念:维度和度量。
维度(Dimension):描述分析的角度和属性,分类数据。
时间、地理位置、产品类型等。
度量(Measure):具体的参考数值,数值数据。
元、销量、销售金额等。
原始数据通过
- Excel的数据透视、
- SQL的groupby
- Python的pivot_table
可以获得其维度和度量(或称指标)
常见的初级图表类型
1.1、散点图
解释数据之间的规律。
维度:1+,作为颜色。
度量:2
(结合象限法)
1.2、气泡图
散点图的变种,引入了第三个度量作为气泡的大小。
维度:1+,作为颜色
度量:3,其中1个是气泡大小。
1.3、单轴散点图
维度作Y轴,更倾向于洞察数据在不同类别下的数据规律。
维度:1+,Y轴
度量:2
可用于:
客户消费维度RFM模型、消费金额与其他维度如折扣、会员积分、会员距离等的关系,还有垂直领域消费维度如
- 投资金额和投资次数的关系(金融)
- 最近一次距今消费和使用次数(SaaS)
2.1、折线图
数据随时间变化的趋势。
维度不宜过多,不超过10条,最多7/8条。
维度:1+,可对比
度量:1+
时间维度:X轴
2.2、面积图
折线图的变种。
数据类别之间,随时间趋势的变化关系。
维度:1
度量:2
3.1、柱形图
类别之间的关系
维度:2
度量:1+
3.2、直方图
柱形图的统计型变种。
维度:0
度量:1
3.3、正负比例柱形图
3.4、正负比例条形图
3.5、堆积柱形图/百分比堆积柱形图
3.6、瀑布图
(甘特图)
(甘特图2)
4.1、饼图
环状的柱形图,PPT用得比较多。
维度:1
度量:1
(南丁格尔玫瑰图)
(环形图)
5.1、漏斗图
对转化过程的直观展示,面向PPT。步骤不要超过7个。
维度:1
度量:1
6.1、雷达图
适用于个体数据和属性可视化,比较偏描述性数据,常见于CRM、用户画像。
维度:1+
度量:1+
注:CRM(Customer Relationship Management)客户关系管理。定义:企业为提高核心竞争力,利用相应的信息技术以及互联网技术来协调企业与顾客间在销售、营销和服务上的交互,从而提升其管理方式,向客户提供创新式的个性化的客户交互和服务的过程。
其最终目标是吸引新客户、保留老客户以及将已有客户转为忠实客户,增加市场份额。
常见的高级图表
1.1、树形图
适合数据量较大的情况,尤其在类别较多的情况下。比如各类电商的SKU。
维度:1+
度量:1
注:SKU(Stock Keeping Unit),库存量单位,即库存进出计量的基本单元,可以是以件,盒,托盘等为单位。
SKU是对于大型连锁超市DC(配送中心)物流管理的一个必要的方法。现在已经被引申为产品统一编号的简称,每种产品均对应有唯一的SKU号。
单品:对一种商品而言,当其品牌、型号、配置、等级、花色、包装容量、单位、生产日期、保质期、用途、价格、产地等属性与其他商品存在不同时,可称为一个单品。
2.1、桑基图
桑基图是揭示数据复杂变化趋势的图表。
面积图是线性维度,桑基图可以一对多或者多对一。
维度:2,source,target
度量:1
3.1、热力图
数据在空间(地理空间、网页浏览)上的变化规律。
维度:2
度量:1
也可以是属性和维度的规律组合,比如变成星期表。
维度:1
度量:1
4.1、关系图
展现不同类别之间的数据关系,常见于社交社会媒体。
维度:2 source、target
度量:0+
(以前在知乎上看见过一个分析大神爬取知乎大V的关注和粉丝,做成关系图,感觉非常有意思)
5.1、箱线图
统计用的图表,用来研究和贯彻数据分布,也能对比数据分布。
维度:1+
度量:1
(大学的时候,看研究生学长学姐做报告的图,大多要求箱线图)
6.1、标靶图(子弹图)
变种条形图,用于衡量业务销售完成情况。
维度:1+
度量:2
(甘特图)
7.1、词云图
文本分析利器。PPT常客,卖弄大数据之必备图表。
维度:1
度量:0(??感觉度量是1吧,词的出现次数?)
8.1、地理图
数据和空间之间的关系。
既可以通过经纬度的数值度量绘制,也能通过省市的类别维度绘制。
维度:1(经纬、行政)
度量:1
Dashboard
- 主次分明
- 贴合场景
- 指标结构
5~6个图表
右上角、最大,核心指标。
中等:二级指标
左下角、最小
Who 是谁在使用?
What 用户的目的是什么?
How 用户怎么使用?
后台监控,(满足二八法则,大部分没人看)
不断更新
(笔记里涉及的图片都是跟着秦老师的视频,在excel里练习后做出来的。有一张气泡图,是考虑到一个问题:气泡图能不能底端对齐?看了一些讨论,自己试验出来的。总而言之,Excel也好,PowerBI也好,数据可视化入门很简单,但是要做得好,还要多加练习。)