存儲06-存儲最佳實施規範

  • 2020 年 3 月 31 日
  • 筆記

1.傳統雙控存儲連線

連線方式一:擴柜子容易,直接加入和連線即可,簡單;但是柜子01和02任意一個掉電後,存儲的鏈路中斷了

連線方式二:擴柜子需要動原來的線,容易出問題;但是柜子01和02任意一個掉電後,存儲的鏈路不斷

此時主機上的每個lun有4條路徑;ALUA的情況下2條active,2條passive;AA的情況下,4條都是active。

2.當下分散式存儲連線圖

傳統存儲只有兩個控制器,互聯網路簡單,直接內部PCIE互聯即可。到了分散式存儲時代,控制器數量很多,只能通過外部高速網路連接,如IB或者10G乙太網,見上圖IB。

此時主機上的每個lun的路徑大於4條,多路徑軟體會將路徑優化為4條,因為路徑太多會帶來管理開銷(好不A到B地有20條路徑,管理複雜且容易把人繞暈)。

3.存儲最佳實施規範

1)交付設備清單列表(配置及維保資訊和保修資訊)

2)交付機櫃布局圖

3)交付物理連線圖

4)交付配置文檔和資訊

5)回饋客戶推薦配置和最優配置

做不到以上的廠家或者代理商,其實都是不合格的,後續會導致很多問題。

4.配置最佳實踐

1)存儲配置最佳實踐(這個廠家工程師一般情況下都是能做到位的)

2)SAN交換機zone最佳配置(這個廠家工程師一般情況下都是能做到位的)

3)主機內部多路徑軟體安裝和配置(這個廠家工程師一般情況下都是能做到位的)

4)作業系統和應用與存儲及多路徑適配和調優(這塊目前絕大多數存儲工程師做不到,恰恰是這塊後面會導致很多問題;其實這塊實施方應該給一個推薦的常規應用參數優化checklist)

拿oracle rac舉例吧,明明底層存儲架構支援在線熱擴容和熱更換;但是擴容和更換前,廠家工程師給了一個checklist各種檢查,發現上層系統和應用參數與多路徑和存儲沒有做優化適配,最後不得不停機操作。這種情況就是:當時實施的時候第4步偷懶沒做到位。