0
推荐
2124
阅读
6 种 Python 数据可视化工具
英文:Chris Moffitt ,编译:伯乐在线/李加庆简介在 Python 中,将数据可视化有多种选择,正是因为这种多样性,何时选用何种方案才变得极具挑战性。本文包含了一些较为流行的工具以及如何使用它们来创建简单的条形图,我将使用下面几种工具来完成绘图示例:PandasSeabornggplotBokehpygalPlotly在示例中,我将使用...
1
推荐
3027
阅读
用Python把图做美点:给柱状图穿个衣服
最近老看见各种加了背景的柱状图,比如一下这样的好像是华尔街日报的于是尝试了一下用Matplotlib做了一下由于作者比较懒惰,y值就随机生成了from matplotlib import pyplot as pltimport randomrandom.seed(33)y1=[random.randint(40,50) for i in range(5)]y2=[random.randint(30,40) for i in range(5)]y3=[random.ran...
0
推荐
1399
阅读
左手用R右手Python系列(VII): 排序
排序可能是日常数据清洗过程中比较高频的应用了,今天这一篇给大家介绍R语言和Python中最为常见的排序函数应用。R语言:sortorderrankarrange排序根据对向量排序和数据框的排序要使用不同的函数,以上四个函数中,前三个是针对向量的,最后一个是针对数据框的。sortx%plyr::arrange(class,-value)arrange函数不仅可以实...
0
推荐
1864
阅读
10 分钟 python seaborn 绘图入门 (Ⅲ): Boxplot 与 Violinplot
箱线图——百度百科"盒式图" 或叫 "盒须图" "箱形图",,其绘制须使用常用的统计量,能提供有关数据位置和分散情况的关键信息,尤其在比较不同的母体数据时更可表现其差异。如上图所示,标示了图中每条线表示的含义,其中应用到了分位值(数)的概念。主要包含五个数据节点,将一组数据从大到小排列,分别计算出他的上边缘...
0
推荐
2631
阅读
10分钟python seaborn绘图入门 (Ⅱ): barplot 与 countplot
barplot 条形图seaborn 的 barplot() 利用矩阵条的高度反映数值变量的集中趋势,以及使用 errorbar 功能(差棒图)来估计变量之间的差值统计。请谨记 bar plot 展示的是某种变量分布的平均值,当需要精确观察每类变量的分布趋势,boxplot 与 violinplot 往往是更好的选择。具体用法如下:seaborn.barplot(x=None, y...
1
推荐
3342
阅读
10分钟python seaborn绘图入门 (I): distplot与kdeplot
本文作者 冯雨润,首发于作者知乎,https://zhuanlan.zhihu.com/p/24464836,已获作者授权原创形式发布,欢迎点击【阅读原文】关注支持!Seaborn介绍官方链接:Seaborn: statistical data visualizationhttp://seaborn.pydata.org/index.htmlSeaborn是一种基于matplotlib的图形可视化python libraty。它提供了一种高度交...
0
推荐
2578
阅读
在天猫网页上抓取数据和分析情况报告
作者:李博,原文首发于作者知乎,本文已获作者授权原创形式发布,欢迎点击【阅读原文】关注支持!1,学会了看网页源代码01. 我使用 Chrom 浏览器,在天猫上搜索笔记本电脑,然后选择品牌为 Lenovo / 联想。02. 按下 CTRL+SHIFT+C。当鼠标放到该宝贝页面的任何位置是,可以看到相应的源代码。而宝贝的图片、价...
0
推荐
4113
阅读
Python Seaborn (Ⅴ) 分类数据的绘制
本文作者 未禾,首发于作者知乎,https://zhuanlan.zhihu.com/p/27683042,已获作者授权原创形式发布,欢迎点击【阅读原文】关注支持!我们之前探讨了如何使用散点图和回归模型拟合来可视化两个变量之间的关系,以及如何在其他分类变量的层次之间进行展示。 当然,还有一大类问题就是分类数据的问题了? 在这种情况下,...
0
推荐
3037
阅读
Python Seaborn (Ⅳ) 线性关系的可视化
本文作者 未禾,首发于作者知乎,https://zhuanlan.zhihu.com/p/27593869,已获作者授权原创形式发布,欢迎点击【阅读原文】关注支持!第四章 线性关系的可视化这章介绍的针对回归类型的散点数据的可视化可能是未来机器学习最直接的助理,这章给我的感悟很多。许多数据集包含多个定量变量,分析的目的通常是将这些变量相...
0
推荐
4042
阅读
Python Seaborn (Ⅲ) 分布数据集的可视化
本文作者 未禾,首发于作者知乎,https://zhuanlan.zhihu.com/p/27570774,已获作者授权原创形式发布,欢迎点击【阅读原文】关注支持!第三章 分布数据集的可视化在处理一组数据时,通常首先要做的是了解变量是如何分布的。这一章将简要介绍seborn中用于检查单变量和双变量分布的一些工具。你可能还想看看分类变量的章节...
0
推荐
3358
阅读
Python Seaborn (Ⅱ) 斑驳陆离的调色板
本文作者 未禾,首发于作者知乎,https://zhuanlan.zhihu.com/p/27471537,已获作者授权原创形式发布,欢迎点击【阅读原文】关注支持!颜色显然比图形风格的其他方面都更加重要,因为颜色使用得当就可以有效显示或隐藏数据中的特征。有许多的好资源都可以了解关于在可视化中使用颜色的技巧,推荐Rob Simmon的《series of...
0
推荐
2364
阅读
Python Seaborn (Ⅰ) 艺术化的图表控制
声明本文作者 未禾,首发于作者知乎,https://zhuanlan.zhihu.com/p/27435863,已获作者授权原创形式发布,欢迎点击【阅读原文】关注支持!一直苦于没有系统学习seanborn的教程,似乎市面上也还没有完整的官方文档的学习资料。终于下决心用几天的时间通读下官方文档,并把记录下来。基于官方0.71版本,所有代码和图片皆...
0
推荐
2069
阅读
爬取中国票房网
这篇文章教大家如何抓取CBO中国票房网,首先使用XML包抓取电影票房数据,再通过正则表达式对数据进行清洗,最后对数据进行了可视化分析1.加载所需Rlibrary(XML)
library(ggplot2)
library(ggthemes)
knitr::opts_chunk$set(echo = TRUE)2.抓取表格url<-"http://www.cbooo.cn/year?year=2017"
doc<-htmlParse(url,e...
3
推荐
2130
阅读
实习僧招聘网爬虫数据可视化
我本来对实习僧网站是没什么好感的,因为之前自己在实习僧上投的实习简历几乎全部都石沉大海了(一个文科生偏要去投数据分析岗不碰壁才怪~_~)!然鹅看到最近知乎爬虫圈儿里的两大趋势:爬美图;爬招聘网站。后来大致观察了下,几乎各类大型招聘文章都被别人爬过了,自己再去写免不了模仿之嫌,而且大神们都是用Python去...
4
推荐
1993
阅读
简单网站爬虫的全部技能居然只要三招
写在前面刚开始看爬虫文章的时候,走了不少弯路,我希望我的文章能给你带来一些启发文章结尾有思考题,如果独立完成了,证明你掌握了简单网站爬虫的所有技能当然,文末彩蛋依旧 本文涉及到的技能查看网页源代码和检查元素requests使用BeautifulSoup使用 这三招就是爬取简单网站的全部招数,跟着思路往下看查看...