一种Python爬取百度地图瓦片的方式
- 2019 年 10 月 8 日
- 笔记
瓦片是互联网地图webGIS组织地图数据的一种方式,最近的一个项目需要获取一定区域内的百度地图瓦片;ArcGIS的一个插件ArcBruTile支持很多地图源(如OSM、Bing)的瓦片获取,但是没有百度地图的,Github上的一些项目(如pyMap)也不支持百度瓦片的下载,
因此打算自己去获取。开始是想用百度API的静态图服务,但是我只有一个区域的边界矩形(MBR),而它接受的参数是中心点坐标和zoom的尺度,其请求URL的核心参数为center=116.403,39.914&width=1024&height=1024&zoom=11,要分块下载很麻烦,想了很多办法去算坐标和进行坐标距离换算,走了一些弯路,后来发现百度地图有一个隐晦的支持参数为x,y,z的调用,而x,y的变化是比较有规律的,因此只需要有边界的x和y再叠加就行。我是下载区域内的小图片再拼接为大图使用的,最后有上万张小图片,合并为一个200多MB的大图。

下载下来的瓦片
具体实现过程如下:
1,获取图片
在百度坐标拾取系统(可以用关键词搜索得到网址)网页,先按F12调出控制台,用坐标反查定位到左下坐标,并且调好层级,我要用的是17级的地图,然后找到一张图片手动确定x1和y1;(虽然有逻辑可以根据坐标和层级算x和y,但百度地图版的实现起来还是费些时间的,我没找到现成的代码,如果读者有发现或写过实现这个功能的代码欢迎在评论里告知,非常感谢),再定位到边界的右上角,同样确定好x2,y2,然后用requests库写获取图片的代码,比较建议先定y,改x,我用先循环y的方式保存的图片合并起来更复杂些,循环下去;可以得到整个区域的图片;

百度坐标拾取系统采用瓦片底图
(先验知识:百度地图的瓦片是从左下角算的,而不是Google Map的左上角开始;)
import requests def getTileByXYZ(): #根据x,y,z参数获取瓦片 z=17 xidx=[22568,22676] yidx=[6898,7008] for y in range(yidx[0],yidx[1]+1): for x in range(xidx[0],xidx[1]+1): url="http://online3.map.bdimg.com/tile/?qt=tile&x={x}&y={y}&z=17&styles=pl" "&scaler=1&udt=20180601".format(x=x,y=y) savePngByXYZ(url, x, y, z) print(y) def savePngByXYZ(url,x,y,z=17): #保存图片 r = requests.get(url) sname="./cdZoomImg/cd_{x}_{y}.png".format(x=x,y=y) #这里建议保存编码是y_x 这样下面合并图片也要适当改代码 with open(sname, 'ab') as pngf: for chunk in r.iter_content(chunk_size=1024): if chunk: pngf.write(chunk) pngf.flush()
2,合并瓦片
一共爬了1万多张瓦片,花了40多分钟(这个要看计算机性能),每张瓦片是256*256像素的方形区域;接下来就是合并的过程了,本来打算一次性合并完毕,但是弄得电脑内存不足了,于是先合并x相同的图片到另一个文件夹,形成一个个长条形的图片,每张尺寸变成了256*28672像素,再跑一遍把这些图片合并到一起,就形成了一张27648*28672的地图图片,可以用来作为ArcGIS一些空间分析的底图。

逐步合并瓦片
import os import glob from PIL import Image def complieImg(): #命名规则:cd_x_y.png 左下坐标系 #同一个x 同1列,y增加,图片在上面 #假设输入排好序了 p = "./chengduImg" plst = glob.glob(os.path.join(p, '*.png')) xmin=((plst[0].split("\")[1]).split(".")[0]).split('_')[1] alst=[] #3维 qlst=[] for f in plst: w=((f.split("\")[1]).split(".")[0]).split('_') #['cd', '22568', '6898'] w[0] = f if w[1]==xmin: qlst.append(w.copy()) else: alst.append(qlst.copy()) xmin=w[1] qlst=[] m2 = [256*len(alst[0]), 256 * len(alst)] #im2=Image.new('RGBA', (m2[0], m2[1])) print(m2) psave = "./complexLevel" iw=0 for k in alst:#k里面装的是x相同的值,y应该递增 plen=len(k) msize = [256, 256 * (plen+1)] print(msize) toImage = Image.new('RGBA', (msize[0], msize[1])) for i in range(plen): fromImage = Image.open(k[plen - i - 1][0]) toImage.paste(fromImage, (0 * msize[0], i * msize[0])) sname="/m_{x}.png".format(x=k[0][1]) iw+=1 toImage.save(psave+sname) def complieImgInY(): #合并长条形图片,x变化,y不变 长图是complieImg()里生成的 p = "./complexLevel" #chengduImg plst = glob.glob(os.path.join(p, '*.png')) xmin=((plst[0].split("\")[1]).split(".")[0]).split('_')[1] ima21=Image.open(plst[0]) w=np.array(ima21).shape print(w) psave = "D:/wexcel" plen=len(plst) msize = [w[1]*plen/2, w[0]/2] print(msize) toImage = Image.new('RGBA', (int(msize[0]), int(msize[1]))) for i in range(plen): fromImage = Image.open(plst[i]) fromImage=fromImage.resize((int(256/2),int(msize[1])), Image.ANTIALIAS) toImage.paste(fromImage, (int(i * 256/2), 0)) sname="/chengduMap.png" toImage.save(psave+sname) #保存图片
最后得到一张200多MB的整合图片。最后代码更新于https://github.com/QLWeilcf/LcfGeoProject/tree/master/WebGISLyn。

OutputImg