数据分析的最前段就应该是如何展示数据,用一种直观的方式来表达数据。从tableau上
伦敦霍乱地图 – John Snow
1854. 伦敦 爆发霍乱疫情。 仅仅 10 天的时间,一个住宅区内就有 500 多人死亡。 这种神秘的集体死亡事件格外恐怖,因为没有人知道死亡背后的原因。 只有流行病学家 John Snow 意识到水源是该疾病的传播途径。参考链接:迄今最具影响力的 5 个数据可视化
看了大神做的,那么我自己也练练手
超市销售数据分析
每日销售与30日均线(散点图与均线)
将每日的销售数据绘画出来,因为数据的跨度很大,所以我取用了30日均线。
用了均线之后,明显将波动剧烈的单日销售金额变的平滑;从2013年到2017年,在年底都会出现两个明显的波峰,并且一年比一年有所增加。
按产品分类预测未来一年每月的销售
数据线性回归
上图是2016年每位客户的销售金额和利润金额。这其中有多点的利润是负数,对于这样的销售顾客,我们就需要询问下销售部门,这是什么原因产生的。
对三类顾客做一个线性回归,其中蓝色(consumer)的斜率最大,说明相同的销售金额可以带来更多的利润。在弹出的标签中,有回归方程以及相关系数,0.48的相关性并不是很高。
Tableau还有很多的功能等待着我去发现。比如可以在Tableau中画出世界地图,然后在各国之间进行各类指标的比较。比如下图中各国的二氧化碳排放量,很直观,越深排放量越大。
地图的数据来源于OpenStreetMap