国服帅座

数据分析

0
推荐
1392
阅读

Stata数据可视化

作者:Economicoder公众号:数据学徒1. 单个变量(1). 连续型histogram mpg, freqkdensity : 直方图,freq将频率改为频数,kdensity添加密度图kdensity mpg, title("核密度估计") : 密度图,注意此处的 kdensity 不可简写为 kden(2). 离散型(聚合)graph hbar (count), over(foreign...

发表了文章 • 2021-02-24 15:55 • 0 条评论

0
推荐
899
阅读

Stata数据处理

作者:Economicoder公众号:数据学徒1. 快捷键Fn + F2 :  描述数据(describe)Fn + PgUp :  搜索先前命令Ctrl + 8 :  打开 data editor (browse)Ctrl + 9 :  新建do文档Ctrl + D :  执行在do文档中选中的命令clear :  删除存储数据cls :  cle...

发表了文章 • 2021-02-06 14:48 • 0 条评论

0
推荐
1523
阅读

R语言将大型Excel文件转为dta格式

作者:Economicoder微信公众号:数据学徒本文以2000年度我国工业企业数据库为例,该文件后缀名为xlsx,包含约16万条记录,文件有88M这么大。直接使用Excel打开都费劲:等待时间久,电脑风扇呼呼呼作响。如果尝试用Stata打开该xlsx文件,则会出现提示报错。报错原因在于,Stata无法读取超过40M的Excel文件。这就好比瓜迪...

发表了文章 • 2020-12-26 14:33 • 0 条评论

0
推荐
1347
阅读

打开高德地图的神秘钥匙

作者:Economicoder微信公众号:数据学徒有了高德地图的导航,我们便能踏遍祖国的绿水青山。其实,高德本身也是一座金山银山,蕴藏着丰富的数据资源。至于数据学徒,愿为一枚小小的数据搬运工。想要进入高德这座矿山,只在其门口念动“芝麻开门”的咒语,哪怕喊破了喉咙,这扇大门也是纹丝不动。要掌握其中的数据资源,必...

发表了文章 • 2020-12-23 18:44 • 0 条评论

1
推荐
1391
阅读

MySQL简要分析猫眼电影TOP100榜

作者:国服帅座    经济学在读硕士知乎ID:国服帅座提出问题对于广大电影爱好者来说,猫眼平台提供了海量电影信息。在其官网上有一个TOP100榜单,我们使用SQL语句简单分析该榜单电影,试图了解如下这些信息。评分最高的电影评分最低的电影上映时间最早的电影周星驰主演的电影按年份统计上映电影数量分别统计喜...

发表了文章 • 2019-03-06 13:38 • 0 条评论

1
推荐
2227
阅读

Selenium登录高德地图爬取驾驶距离

作者:国服帅座    经济学在读硕士微信公众号:统计之家有了高德地图的导航,我们能踏遍祖国的绿水青山。其实,高德本身也是一座金山银山,蕴藏着丰富的数据资源。至于国服帅座,愿为一枚小小的数据搬运工。在先前的众多文章中,小编曾多次尝试爬取高德地图各种数据。所用方法千篇一律,无非是用requests模块...

发表了文章 • 2019-02-22 11:39 • 0 条评论

1
推荐
1983
阅读

Scrapy爬取京东某书评论

作者:国服帅座  经济学在读硕士公众号:统计之家无论是爬取静态网页,还是利用高德地图API获得数据,本文作者都偏好使用requests模块。在本文中,本人爬取京东书评,运用的是Scrapy框架。观察页面结构首先,在京东上搜索某书,以丘祐玮老师的《数据科学:R语言实现》为例,该书评价页面仅有2页,共计14条评论。其...

发表了文章 • 2019-02-14 16:41 • 0 条评论

0
推荐
1594
阅读

大年初六中午,全国各区县哪里最冷?

作者:国服帅座 经济学在读硕士微信公众号:统计之家认识高德地图API在先前的文章中,我们曾了解过如何在高德地图上爬取某地未来三日的天气预报情况。在本文中,我们要使用的是同一个API,获得全国各区县的实时气温。唯一的区别在于,欲返回实时气温,参数extensions应填base。本文撰写时间约为大年初六中午13:30,反映...

发表了文章 • 2019-02-12 19:14 • 0 条评论

1
推荐
1605
阅读

这是一份【洗浴推拿指南】,敬请查收!

作者:国服帅座  经济学在读硕士公众号:统计之家冷风如刀,以大地为砧板,视众生为鱼肉。                                                          ...

发表了文章 • 2019-01-30 08:27 • 0 条评论

0
推荐
2003
阅读

Python双Y轴可视化

作者:国服帅座  经济学在读硕士微信公众号:统计之家数据说明在制图时,我们有时候需要将几条曲线放在同一图中,但这些曲线需要的刻度不同。下面以江苏历年城镇化率数据为例,绘制双Y轴的图。该数据为面板数据,时间跨度为1990-2015,涵盖多项经济指标。我们需要绘制的是后三列指标随时间变动而变动的折线图。不难...

发表了文章 • 2019-01-28 08:24 • 0 条评论

1
推荐
1623
阅读

听说过高德版本的天气预报么

作者:国服帅座    经济学在读硕士知乎ID:国服帅座有了高德地图的导航,我们能踏遍祖国的绿水青山。其实,高德本身也是一座金山银山,蕴藏着丰富的数据资源。至于国服帅座,愿为一枚小小的数据搬运工。认识高德地图API打开“高德开放平台”,点击“开发文档”,在“Web服务”中寻找“天气查询”。之前爬取经纬度时,...

发表了文章 • 2019-01-24 11:24 • 0 条评论

0
推荐
2629
阅读

Python利用正则表达式分离经纬度

作者:国服帅座  经济学在读硕士知乎ID:国服帅座有时候经纬度是合体显示的,通过逗号隔开。如果你只想要经度或纬度的数据,如何让二者分别显示呢?以下介绍几种方法。Excel的方式最简单的方法是,在Excel中先选中经纬度所在字段,然后选择“数据”-“分列”-“逗号”。下表中已经存在10个城市的经纬度数据,以此为例。Py...

发表了文章 • 2019-01-22 10:47 • 0 条评论

2
推荐
2875
阅读

Python调用百度地图API爬取经纬度

作者:国服帅座  经济学在读硕士微信公众号:统计之家你吃肯德基,我点麦当劳。本是替代品,却众口难调。每个人都有独特的偏好,都有一份要坚守的情怀。高德与百度,你心仪哪款呢?认识百度地图API百度与高德在地理编码API上的主要差异,个人归纳如下:a、二者体系独立,所得的经纬度数据略有不同b、百度默认输出格...

发表了文章 • 2019-01-20 18:12 • 0 条评论

0
推荐
7528
阅读

Python调用高德地图API爬取经纬度

作者:国服帅座  经济学在读硕士知乎专栏:https://zhuanlan.zhihu.com/c_1051263791760863232认识高德地图API比起普通的静态网页爬虫,爬高德地图的麻烦之处在于API中存在参数。这需要我们首先要对高德地图API有个基本的了解。登录高德地图API网站,点击“开发文档”,找到下图中的“地理/逆地理编码API”处,点击进入...

发表了文章 • 2019-01-20 17:59 • 0 条评论

0
推荐
2276
阅读

爬虫三步走——以R语言爬取经纬度为例

作者:国服帅座  经济学在读硕士知乎专栏:https://zhuanlan.zhihu.com/c_1051263791760863232爬虫三步走,或者三步骤,或者三部曲,爱咋叫咋叫。第一步,爬取单个数据;第二步,整合为函数;第三步,for循环大批量处理。爬取经纬度有许多种方式,可以用Python或R调用高德(百度)地图API,不过这样略显复杂。本文...

发表了文章 • 2019-01-20 17:50 • 0 条评论