Redis系列9:Geo 类型赋能亿级地图位置计算
Redis系列1:深刻理解高性能Redis的本质
Redis系列2:数据持久化提高可用性
Redis系列3:高可用之主从架构
Redis系列4:高可用之Sentinel(哨兵模式)
Redis系列5:深入分析Cluster 集群模式
追求性能极致:Redis6.0的多线程模型
追求性能极致:客户端缓存带来的革命
Redis系列8:Bitmap实现亿万级数据计算
1 前言
我们在第一篇 深刻理解高性能Redis的本质 的时候就介绍过Redis的几种基本数据结构,它是基于不同业务场景而设计的:
- 动态字符串(REDIS_STRING):整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)
- 双端列表(REDIS_ENCODING_LINKEDLIST)
- 压缩列表(REDIS_ENCODING_ZIPLIST)
- 跳跃表(REDIS_ENCODING_SKIPLIST)
- 哈希表(REDIS_HASH)
- 整数集合(REDIS_ENCODING_INTSET)
除了这些常见数据类型,还有一些不常用的数据类型,如 BitMap、Geo、HyperLogLog 等等,他们在各自的方向为不同的类型的数据统计给出解决方案。
上一篇我们说了位图(BitMap)计算,可以应用于任何大数据场景下的二值计算,比如 是否登录、是否在线、是否签到、用户性别状态、IP黑名单、是否VIP用户统计 等等场景。
这一篇我们来介绍下Geo,分析它在 坐标记录、位置计算、距离计算上的能力,以及在地图业务中的应用场景。
2 了解一下 Location Based Services
Location Based Services,记作 LBS,基于用户的地理位置数据定位展开的服务,广泛应用与地图类(百度地图、高德地图)、电商团购类(美团、饿了么)软件。它常见的使用场景有:
- 计算用户的精准的地理坐标位置
- 统计用户定点坐标一定范围内的其他地理位置,并计算出距离
- 对一定范围内的地理位置进行排序,并由近到远筛选
有没有感觉很熟悉,当然了,在我们的身边到处都是这样的应用场景。
3 Geo所支持的能力
Redis 的 GEO 特性在 Redis 3.2 版本就有了, 这个功能主要是用于存储用户地理位置信息,并对这些信息进行操作。
GEO 的数据结构总共有六个命令,我们一个个来介绍 :
- geoadd
- geopos
- geodist
- georadius
- georadiusbymember
- gethash
3.1 GEOADD 添加经纬信息
Redis 提供了 GEOADD key longitude latitude member 命令,将一组经纬度信息和对应的所属对象的信息 记录到 GEO 类型的集合中,指令如下
GEOADD key longitude latitude member [longitude latitude member ...]
longitude latitude member
分别指给定的空间元素:维度、精度、名称
,这些数据会以有序集合的形式存储在给定的键里面。
我们举个例子,如果你在地图上查找美食,那应该会出现一堆餐饮店铺和坐标位置,那他们的空间信息存储可能是这样的。
redis> GEOADD food:location 115.775632 39.483256 "东北饺子馆" 114.081569 39.692756 "兰州拉面"
(integer) 2
3.2 GEOPOS 获取给定位置的经纬
提供对应的键和位置名称,返回相应的经纬度信息。
GEOPOS key member [member ...]
按照上面的例子,我要获取对应的美食店位置坐标信息如下:
redis> GEOPOS food:location 东北饺子馆 兰州拉面 NonExisting
"115.775632 39.483256"
"114.081569 39.692756"
3.3 GEODIST 返回给定两个位置距离
很多时候,我们要导航去一个地方就会用到这类需求。打开百度或者高德地图,起始位置就定位用户当前位置,目的地定位为搜索到的地址,比如上面的 东北饺子馆。
这时候地图软件需要计算出两个坐标之间的举例,来推荐用户是飞机高铁、开车、还是步行。那么获取给定两个位置之间的距离就变得非常重要,GEODIST就是用来解决这个问题的。
GEODIST key member1 member2 [unit]
上述指令可以返回两个给定位置之间的距离,unit是距离单位,可选项,默认为m,枚举如下:
- m:表示单位为米
- km:表示单位为千米
- mi:表示单位为英里
- ft:表示单位为英尺
需要注意的是如果两个位置之间的其中一个不存在, 那么会返回空值。下面代码计算出 东北饺子馆 和 兰州拉面 店铺之间的距离,大概是6.1公里。
redis> GEODIST food:location 东北饺子馆 兰州拉面
"6184.15156"
3.4 GEORADIUS 获取给定经纬度的固定距离内的位置信息
很多种应用场景是我登录了外卖APP,也确定了我自己所在的位置(即已确知经纬),需要获取一定距离范围内(比如10公里),所有的餐饮店。
这时候就使用到了 GEO 提供的 GEORADIUS指令了:根据输入的经纬度,查找以这个经纬度为中心的一定距离内的其他位置信息。
GEORADIUS key longitude latitude radius m|km|ft|mi [WITHCOORD] [WITHDIST] [WITHHASH] [ASC|DESC] [COUNT count]
key longitude latitude
: 是前置条件,给定的经纬度信息,以及我要搜索的keyradius
:距离半径,指的搜索的范围m|km|ft|mi
: 为给定的距离单位,有 米、千米、英尺、英里 4种[WITHCOORD] [WITHDIST] [WITHHASH]
: 为返回的信息类型- WITHDIST: 在返回位置元素的同时, 将位置元素与中心之间的距离也一并返回。距离的单位和用户给定的范围单位保持一致。
- WITHCOORD: 将位置元素的经度和维度也一并返回。
- WITHHASH: 以 52 位有符号整数的形式, 返回位置元素经过原始 geohash 编码的有序集合分值。这个选项主要用于底层应用或者调试, 实际中的作用并不大。
ASC|DESC
:可选参数,按照距离升序或者降序排列,即 由近到远(asc) 还是 由远到近(desc)COUNT count
:取数数量,避免获取到太多的信息,返回太多信息
所以如果需要获取 距离本人位置10公里半径内由近到远的美食店排序,按km单位计算,返回值带上距离信息,并只取前100个的信息,代码如下:
redis> GEORADIUS food:location 115.791331 39.5120003 10 km WITHDIST ASC COUNT 100
"东北饺子馆" 3.3421
"兰州拉面" 9.4571
下图的绿色区域在固定半径(红圈)中搜索到了特定的几个目标位置:1、2、5、9、10。
3.5 GEORADIUSBYMEMBER 按照位置名称获取
与 GEORADIUS
的区别是 GEORADIUSBYMEMBER
的中心点是由给定的位置元素决定的, 而不是像 GEORADIUS 那样,通过传入经度和纬度来决定中心点。
所以如下,已知兰州拉面和东北饺子馆的距离是6.1公里,根据兰州拉面获取10公里范围内的距离的美食店,可以获取到东北饺子馆和自己的位置:
redis> GEORADIUSBYMEMBER food:location "兰州拉面" 100 km WITHDIST
"东北饺子馆" 6.09127
"兰州拉面" 0
3.6 ZREM 删除关闭的店铺
redis> ZREM food:location "兰州拉面"
(integer) 1
4 总结
- GEO 使用了 Sorted Set 集合类型,并通过 GeoHash 编码方法实现了经纬度到 Sorted Set 中元素权重分数的转换,涵盖两个关键能力就是就是对二维地图做区间划分,以及对区间进行编码。
- 具体可应用的场景如下:
- 计算用户的精准的地理坐标位置
- 统计用户定点坐标一定范围内的其他地理位置,并计算出距离
- 对一定范围内的地理位置进行排序,并由近到远筛选
- 真实的地图数据存储,场景比这复杂的多,数据量会达到惊人的巨量,所以还是会使用分治原理进行拆分,细化到一个市甚至一个区,来提高存储和检索的效率。