怎么样用Python实现地理编码

浏览: 1700

引言

今天看到一篇阿里云的文章天下武功,唯快不破,以物流行业为例,分析了 PostgreSQL 与 Greenplum 在地理位置信息处理,最佳路径算法,机器学习等方面的物流行业应用方法。其中提到了地址转换成坐标的问题,更专业些的名词应该是“地理编码”,即知道一个地址,如北京市海淀区上地十街10号,怎么样可以获取到对应的经纬度位置信息(40,116),或者反过来。

地理编码概念

很多地图相关的厂商都提供了相关的API,我们可以直接利用这些API得到这些信息。比如百度的Geocoding API

Geocoding API是一类接口,用于提供从地址到经纬度坐标或者从经纬度坐标到地址的转换服务,用户可以使用C# 、C++、Java等开发语言发送请求且接收JSON、XML的返回数据。Geocoding API包括地址解析和逆地址解析功能:


借用ESRI文档中更直观的一张图


地理编码:即地址解析,由详细到街道的结构化地址得到百度经纬度信息,例如:“北京市海淀区中关村南大街27号”地址解析的结果是“lng:116.31985,lat:39.959836”。同时,地理编码也支持名胜古迹、标志性建筑名称直接解析返回百度经纬度,例如:“百度大厦”地址解析的结果是“lng:116.30815,lat:40.056885” 。

逆地理编码:即逆地址解析,由百度经纬度信息得到结构化地址信息,例如:“lat:31.325152,lng:120.558957”逆地址解析的结果是“江苏省苏州市虎丘区塔园路318号”。

不过,需要说明的一点是,若想使用百度的这套API的前提是,有百度账号并申请相应的Key。其实,除了百度之外,谷歌、ESRI、微软的Bing等都有类似的地理编码服务。不过这些服务大多没有专门针对Python的库并且彼此之间的Json结构也不一致。于是乎专治不服的Python大神做了一个专门的地理编码工具geocoder,将这些不同厂商的服务整合统一起来。

地理编码工具geocoder

首先看一下它都支持哪些公司的地理编码服务:

Clipboard Image.png

Clipboard Image.png

安装

pip install geocoder

地理编码

import geocoder
g = geocoder.google("1403 Washington Ave, New Orleans, LA 70130")
g.latlng

输出为

[29.9287839, -90.08421849999999]

也可以查看完整的geojson

g.geojson

输出为

{'bbox': [-90.0855674802915,
 29.9274349197085,
 -90.0828695197085,
 29.9301328802915],
'geometry': {'coordinates': [-90.08421849999999, 29.9287839],
 'type': 'Point'},
'properties': {'accuracy': u'ROOFTOP',
 'address': u'1403 Washington Ave, New Orleans, LA 70130, USA',
 'bbox': [-90.0855674802915,
  29.9274349197085,
  -90.0828695197085,
  29.9301328802915],
 'city': u'New Orleans',
 'confidence': 9,
 'country': u'US',
 'county': u'Orleans Parish',
 'encoding': 'utf-8',
 'housenumber': u'1403',
 'lat': 29.9287839,
 'lng': -90.08421849999999,
 'location': '1403 Washington Ave, New Orleans, LA 70130',
 'neighborhood': u'Garden District',
 'ok': True,
 'place': u'ChIJGyFHWc2lIIYRYSoneaXAUiw',
 'postal': u'70130',
 'provider': 'google',
 'quality': u'street_address',
 'state': u'LA',
 'status': 'OK',
 'status_code': 200,
 'street': u'Washington Ave'},
'type': 'Feature'}

直接用Google尝试查询中文地址时失败

g = geocoder.google(u"北京市海淀区上地十街10号")
g.ok

输出为

False

用百度应该没问题,不过我没有申请相应的key。切换到arcgis,能够成功编码

g = geocoder.arcgis(u"北京市海淀区上地十街10号")
g.latlng

输出为

[40.050934, 116.30079]

逆地理编码

g = geocoder.google([29.9287839, -90.08421849999999], method='reverse')

print g.address
print g.city
print g.state
print g.country

输出为

1403 Washington Ave, New Orleans, LA 70115, USA
New Orleans
LA
US

换成中国的地址

g = geocoder.google([40.050934, 116.30079], method='reverse')
print g.address
print g.city
print g.state
print g.country

输出为

Bai Du Da Sha, Haidian Qu, Beijing Shi, China, 100193
Beijing
Beijing Shi
CN

用arcgis的服务试试

g = geocoder.arcgis([40.050934, 116.30079], method='reverse')
print g.address
print g.city
print g.state
print g.country

输出为

None
北京市
北京市
CHN

Google转换成的是英文,但地址比较全。arcgis虽然是中文,但是详细的地址居然输出为了None,这有个X用。

其他

geocoder 的功能不止于此,它还可以查IP(包括自己的)。

g = geocoder.ip('199.7.157.0')
print g.latlng
print g.city
g = geocoder.ip('me')
print g.latlng
print g.city

输出为

[43.6934, -79.4857]
Toronto
[51.05, 13.75]
Dresden

查询一个城市的空间包围盒

g = geocoder.arcgis(u"山东")
g.bbox

输出为

{'northeast': [38.976997, 121.976998], 'southwest': [33.022997, 116.022998]}

小结

空间信息既可以利用行政区划、自然地理区域等文本信息描述,也可以用坐标系统、数字(邮编等)来标识。利用地理编码技术,可以将空间信息的地理定位要素与相应的文本信息关联起来。本文主要介绍了geocoder地理编码这一小工具,可以方便快捷的利用地图等相关厂商提供的地理编码服务,将文字描述的位置转换成地图上的经纬度,或者通过地图上的某个位置坐标获得相应的位置信息文字描述。


推荐 0
本文由 时空Drei 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册