[原创连载]应用PBI搭建淘宝店铺数据分析模型教程-1

浏览: 1876

序:本套文章共3篇,将从Power BI的数据处理,建模和数据可视化三个模块讲解搭建淘宝店铺数据模型的过程,共分3周更新,每周更新1篇。

本篇是系列文章的第一篇,介绍Power BI处理数据的方法技巧。

总体步骤

第一篇、数据处理

            1、数据预处理

            2、数据加载

            3、数据合并

第二篇、建立数据关系建模

            1、添加维度表(中间表)

            2、建立表格建模

            3、添加数据度量值

第三篇、数据图形化展示

            1、根据数据类型来选择图形展现

正文


首先,我们先来了解一下什么是Power BI?

Power BI 是一套商业分析工具,用于在组织中提供见解。可连接数百个数据源、简化数据准备并提供即席分析。生成美观的报表并进行发布,供组织在 Web 和移动设备上使用。

Power BI的界面十分简洁,但是它的功能十分的强大,它拥有Excel中的Power Query和PowerPivot这两个强大的功能,是这两者的集合体。除此之外还有更漂亮的动态可视化效果。

image.png

作为一名合格的店铺运营,我们必须要对店铺中的关键数据指标了如指掌,了解每一天数据指标的变动,发现问题并及时给予修正。但是面对店铺中大量的数据指标,如果没有一个强大而便利的工具将这些繁杂数据进行整理并直观地展现出来,每天面对这些数据是让人头疼不已的。基于这个问题,下面我们利用强大而简易地“Power BI”来针对店铺的数据来做一个数据建模,实现数据之间的联动,更直观的观察数据。

一、数据清洗

1、数据预处理

 1.1 文中数据采用了5个店铺的数据,它们分别是:店铺取数、店铺流量来源、商品效果、宝贝1流量来源、宝贝1手淘搜索关键词效果。数据是每天都会变化的,因此下载数据的时候必须是将每一天的数据进行单独下载(这里所需要到的数据都需要单独每天下载(自助取数这个数据例外))下图:

image.png

 1.2 将数据下来之后,首先需要针对数据表格进行清洗,所谓的清洗就是删除表格开头的几行空数据进行删除,如下图:

image.png

每种数据都需要进行清洗并分别存放在单独的文件夹中。

(批量删除表格的小工具可以通过私信获取。)

*如果数据未进行清洗,那么就会出现下图的错误*

image.png

将数据处理好之后就可以开始我们的店铺数据建模之路了。

2、加载数据文件

2.1 按照图上的步骤操作:点击 “获取数据”-“更多”

image.png

2.2 选择 “文件夹”– “连接”

image.png

2.3 选择需要加载的数据所存放在的对应文件夹

image.png

2.4 点击编辑把数据加载到Power BI中进行编辑处理

image.png

2.5 点击自定义列并输入命令: “Excel.Workbook([Content])”后点击确定

image.png

2.6 选中刚添加的“自定义列”,用鼠标右键选择自定义列在弹出的菜单中选择“删除其他列”

image.png

2.7 点击“自定义列”右边的小箭头对数据进行释放,去除不需要的“Name”数据,“使用原始列名作为前缀”可以根据个人喜好进行勾选

image.png

2.8 将“Data”数据继续进行释放

image.png

2.9 下图显示的就是我们把“店铺取数”文件夹中多个表格的数据合并后的结果。目前数据还无法使用,需要进行一些整理 。

image.png

3、整理、清洗数据文件

3.1 将图中红框部分的标题点击对应的选项“将第一行用做标题”;

image.png

3.2 由于多个表格进行合并导致每个表格的标题都会存在数据之中,需要将它们进行筛选:点击任意一列右侧的小箭头找到对应的标题筛选掉。如上图的“统计日期”

image.png

3.3 检查数据是否有缺失,如上图中的“-”为缺失数据,需要对其进行处理

image.png

3.4 点击“转换”- “替换值”输入我们需要替换的“-”把它全部改为“0

image.png

3.5 处理好数据之后鼠标点击任意单元格,按CTRL+A将表格进行全选,并点击“检测数据类型”让Power BI对表中的数据进行自动识别,并更改为对应的数据类型

image.png

3.6 检测完毕之后这份数据就算是处理好了,点击“关闭并应用”按钮,将数据进行上传待命。

image.png

3.7 加载店铺其他数据(下图加载的是店铺的无线流量来源数据)加载方式可以看1.1-1.4的步骤,需要注意的是:在这个无限来源的数据中,并未包含日期维度,这个时候我们需要将日期维度添加到表格数据中,选中“Name”这一列,点击“添加列”中的“提取”-“范围”

image.png

3.8 读取文本的起始位置是从0开始计数的,从“【”到“2”一共17个字符,而我们需要的日期字段“2017-12-01”是10个字符数。如:“【生意参谋平台】无线店铺流量来源–2017-12-01_2017-12-01.xls”

image.png

3.9  提取完日期数据之后步骤和之前的一样,输入:“Excel.Workbook([Content])”将数据表格进行合并

image.png

之后的操作步骤就和之前的一样,分别“提升标题”,“筛选多余的标题数据”,“修改数据类型”,“关闭并应用”。

待续……

下一篇将会对数据之间进行关系建模的步骤进行讲解,敬请期待!


作者简介:二十二,在零一师门中排行第二十二位,故而唤我二十二,在2017年8月入的师门,主要目标是在数据分析方面深入钻研。虽然入师门的时间不长,但是受到师父影响最深的就是“学海无涯乐做方舟”这种精神,希望能在数据分析之路上结交更多共同爱好的朋友一起交流分享。微信号是:njh586

版权说明:零一公众号内容均为原创,如需转载请联系。

image.png

推荐 1
本文由 零一老师 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册