磁碟陣列典型問題分析
- 2020 年 2 月 11 日
- 筆記
在磁碟陣列在線支援的過程中,會遇到一些常見的問題,現將有典型意義的問題分析如下
1.在伺服器往盤陣中寫入或讀出數據時報錯(如I/0 error,讀寫延緩失敗等),或不能寫入數據,或寫入過程中出錯
1) 檢查SCSI線及SCSI卡有無鬆動.
2)判斷盤陣型號:如果是SCSI介面類型的盤陣,第一思路是查看盤陣的主機通道介面有無接錯,如果將SCSI線接到了out口,極易出現這種故障現象,這時一定要提醒用戶先關閉伺服器,再關閉盤陣,稍等片刻,等靜電釋放完畢後立即將SCSI線換接到in口
3) 查看通道速度:
正常情況下本公司盤陣的通道頻率都為160MHZ(對應傳輸速率為320MB/s),如果發現磁碟通道頻率為80或更低,建議逐一檢查SCSI鏈路上的各部件(SCSI卡,SCSI線,盤陣通道的連通性)必要時可以通過更換主機通道,更換SCSI卡驗證自己的判斷
2.伺服器往盤陣中寫入或讀出數據時速率很慢
1)檢查物理連接,如SCSI線,SCSI卡有無鬆動,SCSI線建議不要太長,以免影響I/0速率
2)詢問SCSI卡型號,若速率為320MB/s的盤陣使用160MB/s速率SCSI卡連接盤陣,會出現伺服器不能訪問盤陣或讀寫速率非常慢的情況
3)查看通道速率,如果發現有人為更改過通道頻率或自身即顯示為80或更低頻率,將會導致速率很慢,可嘗試將其修改到160MHZ
4)查看參數設置:
如讀寫策略
在infrotrend盤陣中寫策略有兩種;write back和write through,默認為write back,使用write back 寫策略時,若伺服器往盤陣中寫數據,控制器會先將數據寫入快取,然後定期寫入硬碟,由於快取I/o速率遠遠高於硬碟I/O速率,所以會提高性能.而使用write through則將導致控制器將數據直接寫入硬碟而不經過快取,可通過修改寫策略提高盤陣性能
在promise盤陣中有讀策略和寫策略
讀策略分read cache,read ahead,no cache三種,默認為read ahead,no cache為讀數據時不通過快取,read cache為讀數據時不從硬碟中讀,而是先將要讀的數據放入到快取中,直接從快取中讀取數據,read ahead則是將本次要讀的數據及下次可能會讀到的數據一起放到快取,讀性能更好
寫策略與infrotrend類似
5)條帶大小的設置
控制器往盤陣中寫數據或從中讀數據都是以條帶為單位進行的,條帶大小範圍從
(8KB-1MB以promise為例,不同廠家可能有所不能),針對不同應用,條帶設置不同可以會使用性能有很大區別
典型的應用有兩類:
a)多媒體或影片點播系統:要求數據I/O次數不能太多,且一次I/O數據量要較大,否則在用戶端會出現多次停頓,因此,要求條帶比較大,條帶大小設置為64K或更大為宜,否則將影響性能
b)資料庫文件訪問:訪問次數比較頻繁,但每次I/O數據量不大,一般為一個表或某幾個欄位的修改,這時要求條帶比較小,一般設置為8K或更小為宜
在常見的盤陣問題在線支援中,遇到的另一個常見問題就是伺服器識別不到盤陣,一般分析思路如下:
作為一個硬體設備,盤陣被伺服器識別有兩個層次,
第一是在伺服器啟動時,HBA卡會掃描硬體設備,這一過程與作業系統無關,因為作業系統此時還沒有啟動
第二是作業系統啟動後,系統中能不能識別到盤陣
因此出現伺服器不能識別盤陣的情況,需要定位到究竟是哪一層次的問題
1.如果是在伺服器啟動時,HBA卡中不能識別到盤陣
1 )檢查盤陣映射是否做好
2 )檢查物理連接,HBA卡及光纖線,SFP或SCSI卡安裝,連接有無問題,如果是光纖卡,查看光纖卡的指示燈狀態是否正常
3 )物理連接正常但仍不能識別盤陣,需要確認
a)HBA卡與盤陣的兼容性
如adaptecSCSI卡與SCSI盤陣不太兼容,詳細內容可查相關兼容列表
b)SCSI線或光纖線,SFP有無破損,若路途通過光纖交換機,查看相應的埠指示燈是否正常
4 )盤陣在售出前都經過嚴格檢測,一般出現故障的可能性不大,只有當上述幾點均確認正常時才考慮盤陣:
若盤陣某一通道不通,可更換到另一通道測試是否正常,若另一通道正常,可能是控制器通道故障,此時可目測通道口有無人為損壞痕迹如彎針等
2.如果是伺服器啟動時HBA卡中能識別到盤陣,但進入系統後不能識別到盤陣
1)首先檢查驅動有無安裝後,如有必要,重新安裝驅動
2)如果能識別到盤陣這一設備,但分區不能識別,典型的情況是windows系統,查看能否將磁碟激活或重新掃描硬體改動
3)光纖盤陣在連接伺服器時有時會出現硬碟更換或重新啟動後不能識別某一分區的情況,此時可重新啟動伺服器和盤陣,如果中途經過光纖交換機,重啟交換機