厉害了!20年【科比NBA】生涯|数据分析

浏览: 2182

这是菜鸟学Python的粉丝第5篇原创投稿

阅读本文大概需要3分钟

本篇作者:小郑同学

    我是一个NBA的球迷,一直很喜欢科比的球风和“曼巴精神”,距离科比退役已经一年多了,前几天是他生日,于是想写一篇文章看一下他的整个NBA生涯的数据情况是怎样的,这应该是一件有趣的事情。

使用工具:Ipython notebook

用到的库:Pandas,Matplotlib

1.数据来源

本次用到的数据来源于https://www.basketball-reference.com/players/b/bryanko01.html,其中可以选择多种形式,我选的是CSV格式,方便后面的数据分析,看看数据长什么样呢

image.png

2.导入数据

1).数据集是一个下载好的csv文件( csv是数据分析金牌御用文件格式),我们把数据导入到pandas之后,初步分析一下

image.png

>>

(20, 30) #数据集是一个20行30列的大表格,正好是20年的数据

看一些数据的基本统计分析信息:

image.png

20年平均得分是24.2分,相当厉害,最高得分是35.4,最低7.6,那我们继续横向探索数据

2).接下来就可以继续分析了,一般来说,我们经常关注的是球员的得分,篮板,助攻,抢断和盖帽的能力,所以我们可以从这5个方面来分析,先来看一下科比的得分的基本情况

image.png

>>

常规赛总得分: 33633.3

常规赛场均得分: 24.9875928678

3).这里的总分会有偏差(实际总分是33643)

因为是根据每赛季的场均得分和场次得来的,所以数据会有出入,科比的得分巅峰是哪个赛季呢 ? 场均得分又是多少?只需两行代码就解决问题

image.png

3).科比的巅峰赛季

科比的巅峰是在05-06赛季,27岁的时候,场均35.4分,要知道场均能上30分就已经很了不起了,果然是巅峰科比,进攻火力太猛了,那我们接着看一下上30分的有哪些赛季

image.png

30分以上的赛季有02-03,05-06和06-07


4).看一下这20年来各项的最强科比的数据

image.png

>>

assistants     6.3

blocks         1.0

point         35.4

rebounds       6.9

steals         2.2

dtype: float64


3.可视化数据

1).为了更好的展现数据的魅力,我们用matplotlib画个图看看吧

x轴用20年(1997-2016)的年份

y轴是每个赛季的得分情况

image.png

image.png


用数据可视化可以非常清晰的看出,96-97刚起步的时候,进步非常快,几乎是火箭般的快速上升,然后30分左右徘徊了3-4年。突然爆发了,黄金赛季在06-07人生顶峰35分,而2014开始慢慢走向低谷,哪到底发生了什么了呢

2).其他的篮板,助攻,抢断和盖帽都可以仿照得分的方式来分析,表中分别对应TRB,AST,STL,BLK,看一下大致情况就好

篮板

image.png

助攻

image.png

image.png

结合前面的数据,我们发现从2013年开始从得分王,开始慢慢的转为助攻王,助攻的得分明显上升甚至达到职业生涯的顶峰,猜想也许是因为体能或者伤痛的原因,转为助攻

综合画一个雷达图

image.png

结论:


这个小例子非常适合小白入门数据分析,综合了很多知识,非常不错,大家若有什么问题,欢迎留言讨论.另外现在投稿非常踊跃,目前累计有20+投稿。有机器学习,爬虫,有数据分析等等,因为我对稿件的质量要求比较高,通过率只有3-4成(稿件一定要通俗易懂),若给大家回复的comments不当的地方,请多多包涵目的只有一个"提供高质量的文章给粉丝",另外我发现粉丝里面高手很多,水平都在不断的上涨,厉害了小伙伴们!!!



推荐 1
本文由 菜鸟学Python 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

3 个评论

没看到在哪里导出数据
没看到在哪里导出数据
关注公众号,获得源码

要回复文章请先登录注册