▓▓那些年那些新人捅的簍子▓▓
1.2021年6月,位元組的一位實習生誤刪了公司機器學習平台 Lagrange Lite 全量 Batch 模型的備份,原因是扁平化管理,實習生與正式員工有同樣的文檔許可權。有人表示刪的都是離線數據,影響不大。還有人表示重新訓練模型和延遲上線,理論上都會對指標有負向,只是不那麼明顯了。

2.亞馬遜扁平化管理,SDE啥活兒都要干,許可權一視同仁。AWS的一個新人在上班第一天做熟悉開發環境自助培訓時,他本來想連測試環境,結果連不上,老員工給了他一個配置,他沒分清哪個是測試的,哪個是生產的,不小心連上了生產環境資料庫,於是把整個資料庫給 Rebuild 了,導致全美 Netflix 停服數小時!
3.2014年某領導安排妹子在生產伺服器上本意卸載重新安裝 Oracle,但腳本中有一句話:rm -rf $ORACLE_BASE/*
不幸變數 ORACLE_BASE 未賦值!
於是乎 Tomcat/MySQL…全刪了!
由於沒有及時發現,造成部分數據寫入磁碟,加大了不可恢復的幾率!
更悲劇的是,找到離線備份,發現備份文件只有1KB,裡面只有幾行熟悉的 mysqldump 注釋。可用的、最接近的備份時間是2013年年底!
欲知後事如何,請看://www.cnblogs.com/zhouyu629/p/3734494.html
4.2021年3月,一位實習生為了炫耀自己的新工作,拍攝並分享了德國柏林海德丁監獄內鑰匙的照片。當地司法部門得知這起泄密事件後,監獄隨即連夜換鎖,舊鑰匙也被立即銷毀。
柏林司法部發言人對媒體說:「所有牢房和通道的門鎖都被更換了,該實習生也被禁止進入監獄,他的實習也就此終止。」他還補充稱,更換600把鎖的費用可能會由這名見習生負擔,預估5萬歐元。
5.某雲計算廠商,一位試用期員工,在業務巡檢系統上,原本應輸入「last reboot」命令,結果看文檔的時候這條命令自動折行了,他只看到了後一句「reboot」,於是這句「reboot」就被自動化工具給廣播出去了,生產環境里所有節點重啟!//感謝網友向昀哥提供這條訊息
6.某年某電商平台雙十一之前,程式碼原本應該用「disconnect」命令來斷開與 Redis 之間的連接,沒想到新人程式碼中寫的卻是「shutdown」命令!於是乎……

昀哥寫作於2021年6月24日
關鍵詞:責任事故,安全,運維,實習生,新人
-全文完,如果覺得有收穫,記得點推薦或「收藏」-