Spring Cloud Alibaba 实战(十三) – Sleuth调用链监控

  • 2019 年 12 月 17 日
  • 筆記

本文概要:大白话剖析调用链监控原理,然后学习Sleuth,Zipkin,然后将Sleuth整合Zipkin,最后学习Zipkin数据持久化(Elasticsearch)以及Zipkin依赖关系图

  • 实战至此,基本功能已经全部实现

1 剖析调用链监控原理

如果我们的项目出现异常了,怎么办呢?

1.1 问题定位需求

◆ 跨微服务的API调用发生异常,要求快速定位(比如5分钟以内)出问题出在哪里,该怎么办? ◆ 跨微服务的API调用发生性能瓶颈,要求迅速定位(比如5分钟以内)出系统瓶颈,该怎么办?

对于这两种情况,传统方式很难解决,需要调用链监控工具排查(有点类似于Linux内核的调用栈日志哦)

调用链监控工具可谓分布式项目维护的必备工具!

1.2 监控的基本原理

  • 譬如说,对于本项目,监控如下请求
  • 定义如下4个时间节点
  • 在DB中维护了一张自关联型数据trace表: 唯一标识,父spanid,服务名称,调用的API,四个时间节点的阶段,数据发生的时间戳

如此一来,正常情况下,一次调用,DB会生成四条数据,即可知道哪个阶段发生问题!

2 优雅地使用 Sleuth

2.1 何为 Sleuth

  • 官方定位 : Sleuth是一 个Spring Cloud的分布式跟踪解决方案 讲人话就是调用链监控工具的客户端

2.2 术语条目

Span (跨度)

Sleuth的基本工作单元,它用一个64位的id唯一标识。 除ID外,span还包含其他数据,例如描述、时间戳事件、键值对的注解(标签)、span ID、span父ID等。

前面我们DB中的一条数据就是一个span

trace (跟踪)

一组span组成的树状结构称为trace

即DB中完整的四条数据

Annotation (标注)

● CS ( Client Sent客户端发送) 客户端发起一一个请求,该annotation描述了span的开始。 ●SR ( Server Received服务器端接收) 服务器端获得请求并准备处理它。 ●SS( Server Sent服务器端发送) 该annotation表明完成请求处理(当响应发回客户端时)。 ●CR( Client Received客户端接收) span结束的标识。客户端成功接收到服务器端的响应。

2.3 为用户中心整合Sleuth

  • 添加依赖

然后直接启动服务即可3 Zipkin搭建与整合 3.1 何为Zipkin Zipkin是Twitter开源的分布式跟踪系统,主要用来收集系统的时序数据,从而追踪系统的调用问题

3.2 搭建 Zipkin Server

Zipkin Server的 API兼容性(微服务通过集成reporter模块,从而Zipkin Server通信) 非常好,对于Spring Cloud Greenwich,Zipkin Server只需安装2.x即可。

  • 下载 : Zipkin官方的Shell下载最新版本curl -sSL https://zipkin.io/quickstart.sh | bash -s 之后 java -jar启动 可看到也是一个SpringBoot应用
  • 查看9411端口
http://localhost:9411/zipkin/
  • 添加依赖,由于zipkin已经包含sleuth,所以移除那个依赖

抽样是为了减少性能损失,默认是只上报0.1的trace数据 调用请求后,zipkin:

  • 由于该请求客户端是浏览器,而其没有集成sleuth,不上报zipkin,所以不显示

4 整合Zipkin之后Nacos报错解决

6 Zipkin数据持久化(Elasticsearch)

配置环境变量,即可把数据存入ES

STORAGE_TYPE=elasticsearch ES_HOSTS=localhost:9200  java -jar zipkin.jar

7 依赖关系图

  • 一般情况下,是不会显示依赖图的
  • 对此,官方有给出说明
  • 使用了ES就需要使用zipkin-dependencies
  • Zipkin Dependencies使用Elasticsearch的环境变量
  • 开始下载
curl -sSL https://zipkin.io/quickstart.sh  | bash -s io.zipkin.dependencies:zipkin-dependencies:LATEST zipkin-dependencies.jar
  • 启动
STORAGE_TYPE=elasticsearch ES_HOSTS=localhost:9200 java -jar zipkin-dependencies.jar
  • 现在就展示依赖图了!实际可以配置定时任务

Zipkin Dependencies指定分析日期

#分析昨天的数据 (OS/X下的命令)  STORAGE_ TYPE=elasticsearch java -jar zipkin-dependencies.jar  `date -uv-ld +%F`    #分析昨天的数据 (Linux下的命令)  STORAGE_ TYPE=elasticsearch java -jar zipkin-dependencies.jar  `date -u -d '1 day ago' +%F`    #分析指定日期的数据  STORAGE TYPE=elasticsearch java -jar zipkin-dependencies.jar 2019-12-25

参考