从300亿条出租车大数据里,我们分析出了五大秘密....

浏览: 2929

上海强生出租车公司的出租车每隔10秒钟会自动向总部的服务器发送一条数据,记录自己所在的经纬度、车速、车内是否有人、行驶方向等信息。2015年上海政府公开了4月一整月的出租车数据,足足有300多亿条,占空间300多G。这些数据被导入了我们的Hadoop平台,以便后续研究。以下是我们初步探究发现的秘密。

- 秘密1 -

上海的交通如烟花般绚烂

0 (3).gif

上图是根据这300亿条数据绘制出的上海各时段各点的车流量示意图,很显然越红越亮代表那个时段的车流量越多,越暗越黑代表那个时段的车流量越少。

可以看到,上海的道路纵横交错,车流量生生不息。市中心理所当然是车流量最集中处,特别是南北高架和延安路高架,哪怕是夜深人静的时候,依然有许多出租车在上面飞驰,可见上海果真是一个不夜城。

右下方通往浦东国际机场、非常显眼的是华夏高架路,它也是一条非常繁忙的道路,连接着中国通向世界各地的窗口。

- 秘密2 -

上海8点13分最堵


上图是根据数据绘制的上海一天中每分钟的车辆平均速度,工作日的六点左右有一个速度高峰,估计那是出租车司机早上出门接人的时候。而7点到9点、17点到20点,是早晚上下班高峰,有两个明显的速度低谷。早高峰车速的最低点发生在8:13,平均车速29KM/H,晚高峰车速的最低点发生在17:47,平均车速30KM/H,这两个时间应该就是上海最堵的时刻了吧。

- 秘密3 -

周六路上并不空

image.png

上图是2015年4月一整月每天出租车的平均车速。很明显,4月4、5、6日三天车速特别快,路上很空,因为那是清明假期,扫墓的扫墓,踏青的踏青,宅的宅,市区人比较少。

另外,周六的平均车速与工作日并无显著差异,而且周六一天内各时段也没有车速低谷(早晚交通高峰)出现,说明周六还是有不少人在街上活动,是不是周六大家都喜欢出门聚会、逛街呢?还是有些事只有周六才有空去办?数据表明,一周中只有周日的车速比较空,路上比较空,看来对于上海这座城来说,只有周日才是真正的休息日啊。

- 秘密4 -

凌晨在岗司机多在车内休息

image.png

数据中有个好玩的现象,白天的时候不管什么时段都有30%左右的出租车车里有人(哪怕仅有司机一个人)、且为“营运”状态,但车速是零。这可能是因为不管什么时候总有30%的车辆在等红灯,毕竟每个十字路口总是一半车辆通行的同时,另一半车辆必须停下等待。

晚上23点以后,这个占比会大幅升高,在凌晨4:08的时候,达到峰值95%。也就是说,凌晨会有很多司机坐在车内,把车顶的灯调成“营运”状态,然后停靠在某个地方休息。据了解,在车内休息的原因是司机想等待附近想乘车的乘客前来敲窗询问。而把顶灯调成“营运”状态是因为司机不想半夜被电话调车中心打扰:电话调车中心会联系“待运”车辆,司机并不想半夜被调度到老远的地方接一个不知道要去哪里的客人。

- 秘密5 -

司机凌晨多停靠在宝山区

image.png

那么出租车司机会把车停靠在哪里呢?上图是根据数据绘制的出租车夜间停靠示意图,越红越亮的点说明停靠的出租车越多。可以看到,虽然到处都会有出租车停靠,但宝山区是半夜出租车停靠的热点区域。据业内人士称,很多出租车司机就居住在宝山的顾村、淞南一带,也许他们上夜班的时候就喜欢在家附近躺在车里休息。

再放来一个上海的可视化图:

1848年,上海开埠,标志着上海进入了近代时期。上海滩的建成不是一天两天,100多年的时间,才让上海从一个海边的小县城变成了今天这样的远东第一大都会。城市数据研究院的院花婧婧从链家网(sh.lianjia.com)的拿到了全上海住宅房的建造历史数据,和我院院草吴博士合作为您呈现上海住宅房百年的发展史。废话不多说,上干货。

0 (4).gif

撰稿+数据可视化:沈雨潇

大数据平台支持:陈超

视觉设计方案支持:张岑

数据挖掘与大数据分析

(datakong)

image.png






推荐 0
本文由 datakong 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册