阿里雲 RDS 資料庫又發 CPU 近 100% 的「芯臟病」
- 2019 年 10 月 21 日
- 筆記
最近雲界發生了2件事,一件是大事,一件是小事,大事是阿里雲與微軟合作推出了開放應用模型 Open Application Model(OAM),小事是由於微軟 SQL Server 在阿里雲上水土不服(僅是我們的猜測),阿里雲 SQL Server RDS 患上了間隙性芯臟病,該病容易在夜間酣睡的時候發病,目前唯一的急救藥是“主備切換”。
對於大事,我們拍手叫好,雲廠商綁定的問題正在被逐步解決。對於小事,我們提心弔膽,阿里雲你可要保重龍體啊,你打個噴嚏,我們都抖三抖,你要是生個小病,我們怎麼活。
在此之前,最近我們已經遭遇了3次阿里雲 RDS 芯臟病發作,詳見 雲上的芯臟病:奇怪的阿里雲 RDS 資料庫突發 CPU 近 100% 問題。昨天 23:50 左右開始,RDS 芯臟病又發作了,又是發生在資料庫伺服器負載極低的時候,又是通過急救藥“主備切換”恢復了正常。
非常抱歉,阿里雲 RDS 芯臟病問題引發的故障再次給您帶來麻煩,請您諒解。
對於這個問題,我們會繼續觀察並考慮以下的應對方法:
1)向阿里雲提交工單,催促阿里雲重視這個問題。
2)用阿里雲 ECS 自建 SQL Server 資料庫伺服器。
3)評估其他雲廠商的雲資料庫服務,如果在阿里雲上實在無法解決,換一片雲試試。
請大家理解我們的小題大做,雲已經變得越來越重,已經成為很多企業的命脈,對於雲上的問題“小題大做”總比“大題小做”好,何況是中國 1 > 2…n之和 的雲呢。