从0开始,教你做数据分析20篇

浏览: 1412

image.png

儿童节快乐,还是老规矩,要先听我吐槽,哈。

最近看到某Excel教程,发现老师用的是WPS,是真的把我惊呆了。Excel是微软Office套件里面的其中一个软件,WPS Office是中国金山的软件,而且WPS里面并没有Excel,WPS名字英文全称是Word Processing System(文字处理系统),后面3个字母分别代表3个软件 W-Word WPS文字;P-Point WPS演示;S-Sheet WPS表格。所以别混淆Excel和WPS表格两者的概念,Excel可以说是一个系统,WPS表格只能说是一个软件。

甚至连老师都混淆视听,这日子没法过了呀!

我最近还发现很多言论在煽动:淘宝已死,微商当立。

看到这类言论我就想笑,同时也悲哀。笑的是他们胡说八道,悲哀的是这种吓唬人的营销手法确实有用,同时也悲哀我的朋友圈已经失去了养分。

做什么事情都会很难,今天无论是做淘宝还是做微商,都难。但我可以肯定的说一句,只要你选择了任一条路,并为之努力,你都能收获。有一碗鸡汤是这样煲的:凡全副精神专注一事,终身必有成就。

到今天我自己都还选择要做淘宝,所以你们懂的。

说到这里,插两条私人广告

广告1:本人招聘(电商)客服妹子,工作地点杭州滨江,我不招远程的,住宿问题我来解决,信得过我零一的,有意向的可以把简历发送到我邮箱2730330187@qq.com

广告2:受派代网邀请,6月3号我在派代讲坛做一次分享,主题是《电商必学入门技能:数据分析》,关键词是入门,我就讲入门级的东西,感兴趣的可以看下面的链接了解。

http://www.epaidai.com/oncourse/

好,镜头切回来。

这个时候问题就来了。有人就会问了,你不是说选择比努力更重要吗?按你这么讲选什么都一样了,不和你之前所的矛盾吗?

选择比努力更重要指的是方向的重要性,淘宝和微商都是渠道,而且他们都有自己的份额,而且现在淘宝还是大份额的。渠道上你有精力的话甚至可以全网铺开,但是,最重要的是你选择的方向,从商业的方向来讲,需要我们抉择的是我们的商业模式,说白了就是挣钱的方式。

有人要短平快,有人要做品牌,也有从来没思考过这个问题的。

有人选择运营品类,有人选择运营人群(社群)

可以说每个人的选择不同,但没有对错,以前我也讲过,资源适配的问题,在不同的条件下选择不同的方式,或许比一条筋的要好得多。这个大家就仁智之见吧。

上次说这篇要讲讲PowerPivot,我们下面就进入主题吧。

首先PowerPivot只支持Microsoft Office Excel 2010/2013/2016 这3个版本

PowerPivot是一个内存数据库,它真的是运行在内存上面的,所以速度要快得多,但同时也占用内存资源。同时它也是一个列数据库

列数据库顾名思义就是数据按列的方式存储,不同于行数据库,行数据库是逐行存储,列数据库要远远快于行数据库,原因就是列数据库是并发的查询,如果有10列,那列数据库会同时10列一起查找,是并发的。

而行数据库是逐行逐列向下扫描。

image.png

举个例子,同样10*10的一个数据块,包含100个单元的数据。假设每检索1个单元的数据用时间是1个单位的时间,如果用行数据库检索整个数据块,需要用100个单位的时间,每1个单元时间运算1个单元的数据。用列数据库只需要10个单位的时间,每1个单位的时间,可以运算10个单元的数据。

如下图所示,行数据库是Z字型的查询方式。100个单元格共花费100个单位的时间。

image.png

如下图所示,列数据库,每列并行运算。100个单元格共花费10个单位的时间。

image.png

PowerPivot是微软用来来填补Excel工作表和BI之间的空隙,让Excel能够处理大量的数据,并给其他BI组件提供数据模型的支持。

Excel 2010是需要额外下载安装PowerPivot的,下载链接

http://www.microsoft.com/zh-cn/download/details.aspx?id=7609

Excel 2013/2016/365 首次插入PowerView时,就会启用PowerPivot。

image.png

PowerPivot会有自己独立的选项卡。

image.png

下面简单介绍一下PowerPivot的基础应用。

示例工具版本:Excel 2013

示例数据集:淘宝搜索结果数据

第一步:将数据添加到数据模型,点击功能键后,输入数据范围。

image.png

image.png

下图是PowerPivot的界面

image.png

在这个界面下,处理的数据量要远远大于Excel的工作表(百万级别)。

在PowerPivot下使用数据透视表和数据透视图都会非常便捷。

image.png

支持单个的表和图,也支持图表混合,两图和四图。常见的排版方式是3图1表(使用水平两图和水平1图1表组合而成),效果如下

image.png

下面我们利用这个数据集插入图和表(1图1表)

image.png

插入图表后,数据透视表字段设置如下

image.png

数据透视图字段设置如下,轴(类别)就是信息图的横坐标,这个设置非常重要,下文的下钻/上钻就是依据这个设置的次序。

image.png

把信息图的横坐标折叠起来,并做一些简单的排版和美化后,如下图所示

image.png

下面我们来体验一下数据模型的下钻功能。双击横坐标轴的1.00-9.99元,它就会进入下一层店铺类型

image.png
双击一下淘宝,就会进入下一层所在地

image.png

这个过程就是数据下钻,同理也支持上钻,双击淘宝即可回到上一刻的界面。

下钻/上钻在BI软件里面算是比较普通的功能,但能在Excel里面实现,意义是不同的。从数据爬取到清洗,再到分析,再到展现,都可以在Excel里面实现,下钻的应用场景很多,比如我锁定到价格100-200的区间,看里面风格,又锁定到甜美的风格,看卖家的地域,又锁定到广州的卖家,看他们采用的材质,等等。

另外,PowerPivot还可以和PowerView协作创建报表。

image.png

也可以和Power Map协作创建地域信息图。

image.png

以上,是PowerPivot在数据展现上的应用,PowerPivot不仅仅是这些。

作为一个数据库,它可以连接MySql、MsSql、BD2、Oracle等主流的数据库,而且,解决了一个痛点,当我们在其他数据库里面的数据大于百万的时候,一往Excel导就会出错,那么之前采用的方法可能会是用其他的软件来处理这些数据,也可能是分批导入Excel里面,但是,整个Excel运行会奇慢无比。

PowerPivot通过连接数据库,能很好的解决以上的问题了。

image.png

PowerPivot还有自己的一套语言,DAX语言,中文名字叫数据分析表达式语言。

看下面一个实例,在PowerPivot里面计算成交量总和。

image.png

我们可以看到,每个字段都会在一对中括号里面[],我们前面说过,PowerPivot是一个列数据库,所以每一个列字段都是一个实例,我们可以直接引用列字段的名字。

成交量总和:=SUM([30天成交])

成交量总和:是我自己命名的一个字段,当然也可以不命名。直接输入

=SUM([30天成交])


等号后面就和Excel的公式基本上是一样的用法,不同的是,Excel里面引用的是范围,比如 A1:A100 ,这种形式,但在DAX的世界里面,没有这种自定义的范围,只能是以列的形式来引用。在Excel里插入表格后也是可以用DAX语言的。

PowerPivot还可以和SharePoint协作,在SharePoint上发布报表,数据分析师可以让老板通过IE浏览器看老板该看的报表,让员工看员工该看的报表,并且可以实时更新。

今天就扯到这里吧。下一篇,可能会分享SharePoint,仅可能啊,我感觉我越写受众越少了,现在净分享大家用不到的东西。我自己也无奈,但我总不能往回写吧?哈哈!随缘吧!老文章点击阅读原文就可以看了。

示例源数据在我网盘里面。不知道我网盘在哪里的,点击阅读原文看看。


PS:回复【文章】二字,或者点击阅读原文 可以查看零一历史发布过的文章和分享的资料。

关注零一,请扫描二维码

推荐 0
本文由 零一老师 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册