数据可视化的目的:是让数据更高效,让报表更美观。
让读者更高效阅读,而不单是自己使用。
突出数据背后的规律和重要的因素。
数据可视化包含两类元素 Dimension——描述分析的角度和属性,分类数据时间、地理位置、产品类型等
Measure——具体的参考数值,数值数据 元、销量、销售金额等
图表在不同工具中的应用主要有:Excel:数据透视
SQL:groupby
Python:pivot_table
本节课主要介绍了以下几种图表:
基础图表
1.散点图——散点图主要解释数据之间的规律。维度:0+,作为颜色 度量:2
气泡图(度量;3)是散点图的变种,引入了第三个度量作为气泡的大小。
单轴散点图(维度:1+,y轴 度量:2 )维度作Y轴,更倾向于洞察数据在不同类别下的数据规律。
具体应用:
客户消费维度——
消费金额和消费次数的关系
消费金额和最后一次距今消费天数的关系
消费次数和最后一次距今消费天数的关系
客户其他消费维度——
消费金额和消费折扣的关系
消费金额和会员积分的关系
消费次数和会员距离的关系
垂直领域消费维度——
投资金额和投资次数的关系(金融)
最近一次距今消费和使用次数(SaaS)
2.折线图——折线图经常用来观察数据随时间变化的趋势。折线图中的维度不宜过多,否则会非常混乱和复杂。
维度:1+,可对比 度量:1+ 时间维度:X轴
面积图——面积图是折线图的变种。面积图更注重数据类别之间随着时间趋势的变化关系。
维度:1 度量:2
3.柱形图——柱形图是类别之间的关系。 维度:2 度量:1+
直方图是柱形图的统计型变种。维度:0 度量:1
4.饼图—— 饼图可以理解为环状的柱形图。饼图的类别不宜过多。饼图除了PPT,分析时没啥用。维度:1 度量:1
5.漏斗图——漏斗图是对转化过程的直观展示。单一的漏斗图没用,面向PPT。转化步骤不应该超过七个。维度:1 度量:1
6.雷达图——适用于个体的数据和属性可视化,比较偏描述性数据,常见于CRM,用户画像。维度:1+ 度量:1+
高级图表:
1.树形图——树形图适合数据量较大的情况,尤其类别较多。比如各类电商的SKU。维度:1+ 度量:1
2.桑基图——桑吉图是揭示数据复杂变化趋势的图表。面积图是线性维度,而桑基图可以一对多或者多对一。
维度:2 source,target度量:1
3.热力图——热力图表现数据在空间上的变化规律。譬如地理空间,譬如网页浏览。 维度:2 度量:1
热力图也可以是属性和维度的规律组合,比如把它变成星期表。维度:1 度量:1
4.关系图——展现不同类别之间的数据关系,常见于各类社交社会媒体。维度:2 source target 度量:0+
5.箱线图——箱线图是统计用图表,用来研究和观察数据分布,也能对比数据分布。维度:1+ 度量:1
6.标靶图——也称为子弹图,是变种的条形图。常用于衡量业务销售完成情况。维度:1+ 度量:2
7.词云图——文本分析利器,PPT常客,卖弄大数据之必备图表。维度:1 度量:0
8.地理图——数据和空间之间的关系。地理图即可以通过经纬度的数值度量绘制,也能通过省市的类别维度绘制。
维度:1(经纬或行政) 度量:1
可视化工具:BI
单一的图表没有意义,多个表格才能形成相互的规律。
把各个报表放入设置的模型,经过数据清洗后转化为各个可视化图表,按照对应关系展示在Dashboard上。
Dashboard标准:主 次 分 明 贴 合 场 景 指 标 结 构(核心指标 二级指标)
具体使用场景举例:
销售人员分析(散点图) 卖家分析(散点图)
销售人员完成率(子弹图) 总体KPI 卖家销售额完成率(子弹图) 销售KPI
设置 Dashboard要明确三个问题:
Who 是谁在使用?
What 用户的目的是什么?
How 用户怎么使用?
商品月销售额 购买人数折线图
SKU树型图 购买频次折线图
销售额 = 购买人数 * 购买频次 * 笔单价 笔单价折线图