开工第一天,我只巡检到了晚上9点,饭碗是不是要没了?

  • 2020 年 2 月 14 日
  • 笔记

我姓王,同事都叫我隔壁老王,这是有典故的。

我们技术总监就坐在我隔壁。每次网站挂了,同事们远远就能听见总监的怒吼:“把隔壁老王给我叫来!”

所以大家都知道公司有个隔壁老王,老出Bug。

天知道我已经多久没睡过囫囵觉了,我宁可用再单身十年来换公司系统的一生平安。

我每天比普通员工以及运维早半小时到公司,第一件事就是开始检查数据库的监控,进行数据库巡检,确认没有问题或者及时发现问题并在上班时间之前解决问题。

现在特殊时期,在家远程办公,暂时从同事们的耳朵里消失的我,就再也没和工作分开了。

今天是开工第一天,我穿着睡衣对着一大堆指标项、巡检项以及冷冰冰的监控数据、日志数据等,重复着第一轮巡检过程。

比如:

数据库环境,如操作系统资源、操作系统配置、数据库软件版本等。

数据库配置,如数据库参数配置、日志配置等。

数据库资源,主要分为空间资源、内存资源、进程资源等。

数据库对象,如大表、大索引、无效对象是否合理等。

数据库安全,如是否存在超级权限、弱口令用户等。

数据库性能,主要分析数据库性能的变化趋势及发展规律等。

数据库灾备,主要分析数据库灾备是否运行正常。

而如此忙碌的巡检工作经常会被打断,总是有突如其来的访问性能问题或故障需要紧急响应,甚至要做一些临时的应急操作。

我在app买的菜,叶子在小区门口晾了大半天都蔫了,也没等到我去接它回家。

一整天的巡检结束了,你以为我能喘口气了?呵呵,为了我晚上能睡个安稳觉,我需要再次对高危数据库进行2次巡检,检查数据库监控和告警记录,确认没有问题后,终于可以放心给猫主子开个罐头。

主子每天陪我熬夜都瘦了,我却过劳肥又胖了几斤。

晚上,终于有时间思考人生,回想这一天的工作,我好像只是做了巡检??!!

没等我感慨完被浪费掉的生命,系统告警声把我拉回了电脑前。

我牺牲全部时间做的人肉巡检,因为不可控因素太多和偶尔疏忽,遗漏了潜在隐患没有解决,为了避免总监的夺命连环call,我精神高度紧张一遍又一遍的处理故障。

哎,今天洗头又掉了两根头发。

那是我最后的两根。


老王,什么事都靠自己干是不行的,人,总有累倒的一天。

智能巡检

腾讯云数据库智能管家DBbrain提供了一键智能巡检功能,内置AI专家系统辅助巡检。数据库自动化巡检完成之后,AI专家系统实时评估巡检结果,自动产生巡检报告,确保巡检报告的质量。此外,不同的运维场景有不同的巡检需求,DBbrain能提供适应不同场景的巡检报告,并能通过AI优化模块,对巡检中的异常、隐患等给出专家优化建议。

听到你们小声说开工第一天就打广告了,朋友们,这不是广告,这关乎到成千上万DBA的人生幸福!

跟隔壁老王一样,人肉巡检让DBA苦不堪言,巡检项、巡检结论完全取决于DBA技术能力,不同DBA巡检同一套数据库,巡检结果可能会大相径庭。而且数据库越多,巡检报告的质量往往越差,DBA越不容易发现问题。

有聪明的DBA做了脚本巡检,编写自动化脚本巡检数据库。由于巡检脚本是固定的,因此脚本化巡检能相对全面地巡检数据库,但脚本覆盖的场景,以及能否从脚本执行结果中发现问题,仍受限于DBA的技术能力和经验

智能巡检时代,这些烦恼就通通烟消云散了。

开工第一天,线上压力骤然增加,对所有数据库实例进行巡检,将数据库中的潜在风险提前识别出来是十分必要的,也是业务高峰期系统稳定运行的重要保障。

上面的截图来自于DBbrain, 是腾讯云自研的一款可为用户提供数据库性能、安全、管理等功能的智能运维平台。不认识DBbrain的朋友,点击下方视频两分钟即可了解:

DBbrain的健康报告功能日常可以帮助DBA高效率地进行数据库健康巡检,并便捷输出实例巡检结果,直观反映出数据库实例存在的异常、故障以及隐患,并且给出专家级优化建议。

那这个健康报告有什么独到之处吗?

首先,可以为数据库的健康状况打分。将数据库的核心监控指标(例如活跃连接数、CPU、内存、磁盘等)纳入到评分模型中,同时也将结合数据库的历史异常率,慢日志、死锁、审计日志等深层次分析找出潜在问题。

另外,这是在全程无人工干预的状况下生成的健康报告。利用“健康报告”中发现的问题和优化建议,可以在流量洪峰前对数据库进行优化。

最关键的,可以在根源上排查数据库隐患。告别传统扩容和升配,以优化为主升级为辅的方式,做到从根源上解决数据库实例存在的问题和隐患。

报告主要包括介绍、基本信息、健康、实例状态、异常诊断、慢 SQL 分析、大表分析以及性能曲线等章节。

值得一提的是,腾讯云也是业内第一个提供微信移动端数据库智能运维平台的云厂商。通过DBbrain移动端微信小程序,DBA也可以轻松完成数据库巡检工作,还能够通过“微信小程序数据库日报推送”功能,订阅每天的数据库日报,时刻关注数据库运行状况。

在DBbrain的微信小程序端,提供如下核心功能:

• 实时诊断:7*24小时异常发现诊断,提供实时优化建议

• 慢日志分析:慢SQL全方位分析优化,专家级优化建议

• 健康巡检:一键生产数据库巡检报告,细粒度审查数据库健康隐患

• 空间分析:数据库空间使用一览,AI预测助力

• 数据库日报:微信推送数据库每日运行状态,全局掌握数据库质量大盘

老王不用担心,有了DBbrain这个好帮手,别说饭碗能不能保住,升职加薪都是小菜一碟啦~

往期推荐

↓↓点击阅读原文即刻体验