DoItData

立志成为一名优秀的数据分析师,在此记录下学习的点滴,以便和来自五湖四海的数据爱好者交流学习。大数据时代,我们来啦!

1
推荐
3333
阅读

Python爬取58同城广州房源+可视化分析

消失了一段时间,这段时间在CSDN阅读了不少关于Python爬虫的文章,也学习了秦璐老师《七周成为数据分析师》系列的Python内容,主要是关于强大的pandas,后面的可视化课程还没学习~所以这里的可视化都只能用Power BI来绘制,后面会再改进和完善。下面就直入主题,写一写Python爬取58同城广州房源+可视化分析的过程啦。一...

发表了文章 • 2018-05-02 22:38 • 3 条评论

1
推荐
2166
阅读

《七周成为数据分析师》第三周之利用Excel数据透视表分析案例

如图餐饮的原始数据如下: 1.点评数最高的饭店?①最简单的方法就是直接进行“排序—降序”,即可直接得出结果,三宝粥铺(南京东路店)分店是点评数最高的饭店②也可利用公式来找,在某一空白单元格输入“=INDEX(C:D,MATCH(MAX(D:D),D:D,0),1)”即可得出结果:如图,J2显示的便是正解  2.哪个城市的饭店人均口...

发表了文章 • 2018-03-05 14:35 • 0 条评论

3
推荐
2640
阅读

Python基础项目——利用Python爬虫爬取淘宝网某类商品的图片

这是跟着韦伟老师的Python数据分析课程做的爬虫实战项目,在这里记录下来,也方便学习分享。2018-01-28 完成项目:利用Python爬虫爬取淘宝网某类商品的图片 ******Step1******以连衣裙为例,观察淘宝网连衣裙商品第1页、第2页、第3页……网址的规律:https://s.taobao.com/search?q=连衣裙&imgfile=&commend=...

发表了文章 • 2018-03-05 14:18 • 2 条评论

2
推荐
2449
阅读

《七周成为数据分析师》第四周之Power BI操作技巧

接上一节的内容把整个dashboard做了一下调整,在散点图中用不同颜色区分出不同类型,同时也加了树形图,效果如下:然而,当我们在柱形图中点击选择某一个城市的时候,却发现树形图统计的是该城市某某类型菜占全部城市该类型菜的占比,这样我们很难直观进行比较:那么,我们可以让树形图只呈现该城市各类型菜的占比,只做...

发表了文章 • 2018-03-05 13:02 • 1 条评论

4
推荐
2291
阅读

《七周成为数据分析师》第四周之Power BI入门案例

Excel的学习暂告一段落,现在开始Power BI之旅啦~\(≧▽≦)/~啦啦啦!首先Get Data,顾名思义,就是获取数据(这里一般不建议将Excel作为数据源,因为Excel里面会有合并单元格等格式,BI、Python等都比较难处理它们),我选择了餐饮(天善).csv,然后进行加载。先来做个简单的了解,假如我要看每个城市有多少家饭店,那么...

发表了文章 • 2018-03-01 16:46 • 6 条评论

3
推荐
2440
阅读

《七周成为数据分析师》第四周之杜邦分析法

这一周仍是数据可视化的内容,本小节具体讲的是杜邦分析法的应用。杜邦分析法(DuPont Analysis)是利用几种主要的财务比率之间的关系来综合地分析企业的财务状况。具体来说,它是一种用来评价公司赢利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。其基本思想是将企业净资产收益率逐级分解为多项财务...

发表了文章 • 2018-03-01 11:40 • 0 条评论

5
推荐
1895
阅读

《七周成为数据分析师》第四周数据可视化之Excel图表

哈哈哈来到第四周的笔记啦~Excel章节的主要应用是在函数和数据透视表上,在Excel实践中也写得差不多啦~终于进入数据可视化的章节,这是我最喜欢的(也觉得比较费时间的),因为觉得做出好看且高效实用的图表很激动呀!不过有一些图表的制作就相对会比较费时啦~特别是复合图表!!!!下面上传一些在课程中做的图表\(^o^)...

发表了文章 • 2018-02-27 23:52 • 2 条评论

3
推荐
1398
阅读

《七周成为数据分析师》第三周之关联匹配函数

第二节Excel的内容是关联匹配函数,主要有8个函数:在将多张表的内容合并到一张表、索引的时候,关联匹配函数非常重要。1.vlookup和lookupVLOOKUP与LOOKUP用法基本一致,功能也大同小异。这里主要就说说vlookup啦。语法形式:vlookup(lookup_value,table_array,col_index_num,range_lookup),意思为Vlookup(引用单元格,...

发表了文章 • 2018-02-27 17:39 • 2 条评论

4
推荐
2741
阅读

《七周成为数据分析师》第三周之Excel文本清洗函数

啦啦啦,第二周的笔记以后再补上,现在想先趁热打铁,把第三周Excel的实战笔记写上。其实之前仔细《从职场新人到数据分析高手——Excel应该这样学》这本书啃了一遍,而且里面的实战项目也一一跟着做了,算是有excel数据分析基础的。秦璐老师的《七周成为数据分析师》课程简单了讲了一些Excel使用较高频的函数,并系统地分...

发表了文章 • 2018-02-26 00:10 • 0 条评论

3
推荐
2025
阅读

《七周成为数据分析师》第一周之数据分析的思维技巧

第二节是数据分析的思维技巧,主要讲了7种:象限法、多维法、假设法、指数法、二八法、对比法、漏斗法1.2  数据分析的思维技巧1.2.1  象限法下图的RFM模型就是经典的象限法:象限划分可以按照中位数、平均数,或者是经验。1.2.2  多维法多维法即从多个维度进行考虑分析。利用多维法,我们可以看到有一些...

发表了文章 • 2018-02-24 13:39 • 1 条评论

1
推荐
2497
阅读

《七周成为数据分析师》第一周之数据分析的三种核心思维

感谢秦璐老师的《七周成为数据分析师》系列,让我得以系统地梳理数据分析思路,懂得围绕”What?Why?How?“三层来分析问题,解决问题。由于年前家里的零售业工作繁忙,闲暇之余学习了该课程前五部分,受益匪浅,却迟迟没时间上传笔记。今天开始将学习笔记、实战笔记等一一梳理,便于归纳交流。1.1  数据分析的三种核心...

发表了文章 • 2018-02-22 16:50 • 0 条评论