一种Python爬取百度地图瓦片的方式

2019 年 10 月 8 日
笔记

瓦片是互联网地图webGIS组织地图数据的一种方式，最近的一个项目需要获取一定区域内的百度地图瓦片；ArcGIS的一个插件ArcBruTile支持很多地图源（如OSM、Bing）的瓦片获取，但是没有百度地图的，Github上的一些项目（如pyMap）也不支持百度瓦片的下载，

因此打算自己去获取。开始是想用百度API的静态图服务，但是我只有一个区域的边界矩形（MBR），而它接受的参数是中心点坐标和zoom的尺度，其请求URL的核心参数为center=116.403,39.914&width=1024&height=1024&zoom=11，要分块下载很麻烦，想了很多办法去算坐标和进行坐标距离换算，走了一些弯路，后来发现百度地图有一个隐晦的支持参数为x,y,z的调用，而x,y的变化是比较有规律的，因此只需要有边界的x和y再叠加就行。我是下载区域内的小图片再拼接为大图使用的，最后有上万张小图片，合并为一个200多MB的大图。

下载下来的瓦片

具体实现过程如下：

1，获取图片

在百度坐标拾取系统(可以用关键词搜索得到网址)网页，先按F12调出控制台，用坐标反查定位到左下坐标，并且调好层级，我要用的是17级的地图，然后找到一张图片手动确定x1和y1；（虽然有逻辑可以根据坐标和层级算x和y，但百度地图版的实现起来还是费些时间的，我没找到现成的代码，如果读者有发现或写过实现这个功能的代码欢迎在评论里告知，非常感谢），再定位到边界的右上角，同样确定好x2，y2，然后用requests库写获取图片的代码，比较建议先定y，改x，我用先循环y的方式保存的图片合并起来更复杂些，循环下去；可以得到整个区域的图片；

百度坐标拾取系统采用瓦片底图

（先验知识：百度地图的瓦片是从左下角算的，而不是Google Map的左上角开始；）

import requests    def getTileByXYZ(): #根据x，y，z参数获取瓦片     z=17     xidx=[22568,22676]     yidx=[6898,7008]      for y in range(yidx[0],yidx[1]+1):          for x in range(xidx[0],xidx[1]+1):             url="http://online3.map.bdimg.com/tile/?qt=tile&x={x}&y={y}&z=17&styles=pl"                   "&scaler=1&udt=20180601".format(x=x,y=y)             savePngByXYZ(url, x, y, z)         print(y)    def savePngByXYZ(url,x,y,z=17): #保存图片     r = requests.get(url)     sname="./cdZoomImg/cd_{x}_{y}.png".format(x=x,y=y) #这里建议保存编码是y_x 这样下面合并图片也要适当改代码     with open(sname, 'ab') as pngf:          for chunk in r.iter_content(chunk_size=1024):              if chunk:                 pngf.write(chunk)                 pngf.flush()

2，合并瓦片

一共爬了1万多张瓦片，花了40多分钟（这个要看计算机性能），每张瓦片是256*256像素的方形区域；接下来就是合并的过程了，本来打算一次性合并完毕，但是弄得电脑内存不足了，于是先合并x相同的图片到另一个文件夹，形成一个个长条形的图片，每张尺寸变成了256*28672像素，再跑一遍把这些图片合并到一起，就形成了一张27648*28672的地图图片，可以用来作为ArcGIS一些空间分析的底图。

逐步合并瓦片

import os  import glob  from PIL import Image  def complieImg():     #命名规则：cd_x_y.png 左下坐标系     #同一个x 同1列，y增加，图片在上面     #假设输入排好序了     p = "./chengduImg"     plst = glob.glob(os.path.join(p, '*.png'))   xmin=((plst[0].split("\")[1]).split(".")[0]).split('_')[1]     alst=[] #3维     qlst=[]      for f in plst:         w=((f.split("\")[1]).split(".")[0]).split('_') #['cd', '22568', '6898']         w[0] = f          if w[1]==xmin:             qlst.append(w.copy())          else:             alst.append(qlst.copy())             xmin=w[1]             qlst=[]     m2 = [256*len(alst[0]), 256 * len(alst)]  #im2=Image.new('RGBA', (m2[0], m2[1]))     print(m2)     psave = "./complexLevel"     iw=0     for k in alst:#k里面装的是x相同的值，y应该递增         plen=len(k)         msize = [256, 256 * (plen+1)]         print(msize)         toImage = Image.new('RGBA', (msize[0], msize[1]))          for i in range(plen):             fromImage = Image.open(k[plen - i - 1][0])             toImage.paste(fromImage, (0 * msize[0], i * msize[0]))       sname="/m_{x}.png".format(x=k[0][1])         iw+=1           toImage.save(psave+sname)    def complieImgInY():     #合并长条形图片，x变化，y不变 长图是complieImg()里生成的     p = "./complexLevel" #chengduImg     plst = glob.glob(os.path.join(p, '*.png'))   xmin=((plst[0].split("\")[1]).split(".")[0]).split('_')[1]     ima21=Image.open(plst[0])     w=np.array(ima21).shape     print(w)     psave = "D:/wexcel"     plen=len(plst)     msize = [w[1]*plen/2, w[0]/2]     print(msize)     toImage = Image.new('RGBA', (int(msize[0]), int(msize[1])))      for i in range(plen):         fromImage = Image.open(plst[i])         fromImage=fromImage.resize((int(256/2),int(msize[1])), Image.ANTIALIAS)         toImage.paste(fromImage, (int(i * 256/2), 0))   sname="/chengduMap.png"   toImage.save(psave+sname) #保存图片

最后得到一张200多MB的整合图片。最后代码更新于https://github.com/QLWeilcf/LcfGeoProject/tree/master/WebGISLyn。

OutputImg

一种Python爬取百度地图瓦片的方式

VirMach 便宜 VPS

QNews

一种Python爬取百度地图瓦片的方式

分享此文：

Related Posts

游戏测试和软件测试有什么区别？

怎样打造一个DOM元素位置引擎 (一)

一日一技：在 Python 中，is 并不一定包含==

10分钟搭建你的第一个图像识别模型（附步骤、代码）

VirMach 便宜 VPS

QNews

热门搜寻