Snova运维篇(五):snova平台监控告警的使用
- 2019 年 12 月 26 日
- 筆記
本节主要从监控告警的角度,深入了解腾讯云snova平台的监控机制和策略。完善的告警系统,能够获取当前服务端snova的运行情况,当snova某个指标波动超过正常阈值时进行警报提示,以及时止损,保证平台稳定运行和故障修复的及时介入。
目录:
- 告警系统概览
- 配置告警策略
基本概念:
IOPS |
每秒磁盘IO的读写次数 |
---|---|
吞吐量 |
每秒磁盘 I/O 的流量,即磁盘写入加上读出的数据的大小。 |
1.告警系统概览
- 监控地址:用户控制台点击snova进入 https://console.cloud.tencent.com/snova

- 点击集群名称进入详细页面,选择性能监控

- 参数详解:
名称 |
释义 |
---|---|
cpu利用率 |
又称CPU使用率。顾名思义,CPU利用率是来描述CPU的使用情况,表明了一段时间内CPU被占用的情况。 |
内存利用率 |
% |
网络接收吞吐量 |
MB/s 流入网卡 |
网络输出层吞吐量 |
MB/s 流出网卡 |
写入IOPS |
count/s |
读取IOPS |
count/s |
磁盘空间使用率 |
% |
读取吞吐量 |
MB/s |
写入吞吐量 |
MB/s |
读取延时 |
ms |
写入延时 |
ms |
连接数 |
个 |
- 时间粒度

2.配置告警策略
- 搜索云监控

- 选择告警策略并新增

- 新增策略 绑定对象 配置触发条件 添加告警渠道

未完待续;