LTE切換問題定位及優化
- 2019 年 12 月 26 日
- 筆記
切換問題定位總體思路
首先需要確定問題範圍,確認是全網問題還是TOP站點問題,是TOP站點問題還是TOP小區問題,是TOP小區問題還是TOP兩兩小區問題,TOP兩兩小區問題中是單向切換問題還是雙向問題,是否存在TOP用戶。確定出問題範圍的主要目的是,針對TOP問題,找出TOP站點/小區/兩兩小區相對其它非TOP的差異之處,分析為什麼只在這些TOP區域出現問題,找到TOP區域的特殊性,也就解決了問題的一半。
其次,切換問題屬於流程類問題,一個定位思路就是確定切換流程在哪一步失敗,對於實驗室或路測場景,可以從終端和網路側的信令跟蹤、話統和CHR確定流程在哪一步失敗,從而縮小問題的分析範圍。
關聯指標分析
發現切換問題後,需要進行關聯話統指標分析,嘗試從話統角度揭開問題的全貌,並找到一些線索。 分析切換問題,不僅要關注切換成功率,還要關注切換次數和切換失敗次數,分析切換次數是否存在大幅變化。 分析切換問題,要關注目標小區是否也存在接入問題,因為切換入和初始接入都存在隨機接入過程,假設隨機接入過程存在問題,則切換入和初始接入可能都存在問題。 切換失敗也可能導致掉話,在掉話的話統中有單獨的一類話統是統計切換導致的掉話,所以分析切換問題同時也要分析掉話相關指標的變化。 在切換失敗時終端通常會發起RRC重建,根據切換失敗發生在切換流程的不同階段,終端還會攜帶不同的RRC重建原因值,通過分析RRC重建的話統變化也有助於分析切換失敗問題。
問題範圍細化
在確定問題現象之後,需要進一步確定問題範圍,確定問題範圍可以用於提煉問題發生的場景,也可以用於評估問題的影響。
全網問題還是TOP站點/小區問題
問題範圍可以從以下幾個維度來確定: 1、 確定是整網問題、還是TOP小區/站點問題(如果問題小區少於10%,即認為是TOP小區問題); 2、 是否特定載頻問題,確認問題是否只和某個特定載頻有關係; 3、 是否特定核心網下用戶才有問題; 4、 是否特定組網和設備形態問題,如射頻單元為MRRU/MRFU等。
是TOP站點問題還是TOP小區問題
如果確認是TOP站點問題,考慮是主控板/時鐘/基頻板問題。 如果只是單小區有問題而其他小區正常,則基本可排除主控板/時鐘等共性問題,如果多小區建立在一塊基頻板上還可以排除基頻板問題。
是否TOP兩兩小區問題
通過切換兩兩小區對話統找出切換失敗的TOP源、目標小區對,如果存在TOP兩兩小區,還需要進一步確認是單向切換問題還是雙向切換問題。如果是單向切換問題,參照下節,繼續分析是否切換入失敗問題。
關注切換入失敗TOP小區
切換失敗有可能發生在源側,也有可能發生在目標側。在分析話統時一般都是按切換出成功率進行統計的,所以對於目標側出現切換失敗的問題,從切換出話統來分析TOP小區可能就不是很明顯,但如果換一個視角,按照切換入成功率來統計的話,可能問題就會非常明顯。 在分析切換入問題時,可以直接進行切換入失敗TOP小區排序,找出切換入失敗TOP小區,也可以先按切換出失敗TOP小區進行排序,並找到TOP切換失敗兩兩小區對的目標小區,然後分析這些小區的切換入指標。 在找到切換入失敗TOP小區之後,分析是否個別鄰小區切換入失敗,還是所有小區都切換入失敗。如果是所有小區都切換入失敗,則很可能是目標小區存在問題。進一步可以對目標小區的接入KPI指標進行關聯分析,確認是否存在睡眠小區等問題。
TOP用戶分析
當確認出TOP小區或TOP兩兩小區之後,可以進一步確認是否TOP用戶引起,從經驗看,個別用戶反覆切換失敗甚至可能把全網的切換指標拉低(特別在目前LTE網路話務量不大的情況)。個別用戶反覆切換失敗的原因有可能是該用戶所處的位置切換性能差,也有可能是終端個體問題。可以從以下方面來分析是否存在TOP用戶。 如果有TOP小區的標口信令,當用戶在一次連接內反覆切換出失敗又反覆重建回源小區,可以根據CALL ID來判斷是否同一用戶。如果是用戶多次接入多次切換失敗,可以從用戶的TMSI(如果RRC連接請求消息中攜帶了)來判斷是否為同一用戶。如果只有CHR,則只能通過異常用戶的TMSI來判斷是否為同一用戶(因為CHR只記錄異常掉話的用戶,所以很多切換失敗但沒掉話的用戶沒有在CHR記錄)。 如果TOP小區的切換惡化問題存在TOP時段,如一天中只有某幾個小時有問題,其它時段切換指標都正常,則懷疑可能存在TOP用戶,只有它活動的時候指標才會惡化。 在識別出TOP用戶之後,如果能排除該用戶處在弱覆蓋或強幹擾區域,則可以懷疑是終端個體問題,可以通過運營商給用戶置換終端來解決。
問題產生時間點分析
通過分析歷史KPI,找到問題產生的時間點,排查這個時間點前後的告警,故障,操作日誌,看是否有異常。 另外也可以將切換指標和業務量按全天24小時做時段分析,分析切換指標惡化是否和業務量負荷忙閑時存在關係。
優化思路和方向
問題定位之後,可以參考如下思路進行排查優化。

換出成功率低分析
- 問題小區周邊所有站點都切換成功率低:核査該區域站點是否存在GPS失鎖、是否存在MR 弱覆蓋;(大範圍,很多區域內站點切換成功率低)
- 問題小區向所有鄰區切換出成功率低:核查鄰區配置參數是否異常;
- 問題小區內部切換出成功率低,向其他鄰區切換出正常:現場測試排查是否存在隱性故障或 安裝不合理;
- 問題小區向個別鄰區切換出成功率低:核查目標小區是存在告警、干擾;問題小區是否添加同PCI鄰區;是否鄰區配置不合理;
- 小區覆蓋是否合理,導致切換不及時,切換策略相關門限參數是否合理;
切換入成功率低分析
- 所有鄰區向問題小區切換入成功率低:核查小區是否存在干擾、故障、資源不足;
- 核查鄰區配置參數是否異常;是否鄰區配置合理;
- 鄰區是否存在同PCI模三衝突;
- 是否存在干擾。