LTE-5G學習筆記11--零流量小區處理思路

塵封的記憶0發表於2019-01-29

1概述

     目前面對網路建設逐步完善,4G使用者的不斷髮展,針對零流量小區的分析及處理存在著必要性。零流量小區的分佈既是使用者分佈及行為的直觀體現,也是用發展使用者的一個指引,同時也能發現裝置的一些故障。一個站點的能夠帶來怎樣的效益關乎於這個站點的建設的意義,同時一個站點因故障導致零流量也給使用者感知帶來了直接的影響。因此不管從客戶、運營商、裝置商等角度分析,我們有必要對零流量及低流量小區引起高度重視,並優先進行分析處理。

2零流量小區分類

針對現場一個月的零流量小區統計情況分析,干擾、使用者少、基站故障、人為調測、工程問題等都是導致零流量小區的原因。從分佈的情況看很多問題我們還是能夠規避並進行及時處理的,如故障、工程、人為調測等原因。

 

主要分類:

故障問題:

  • 電源:裝置掉電斷站、BBU掉電
  • 硬體告警: X2介面故障、系統時鐘不可用、駐波等
  • 傳輸:傳輸光介面異常、BBU 介面異常、射頻R介面異常

覆蓋、干擾問題:

  • 室外站點覆蓋景區的,景區冬季人少
  • 室外站點覆蓋農村空曠公路的
  • 室外站點覆蓋不合理的,如周圍有村莊、密集人群活動區域,但天線覆蓋方向不合理的

使用者行為問題:

  • 活動場所:偶爾有活動,但週期比較長的。
  • 隨著季節變化,室外使用者變少的
  • 確實是使用者過少的

工程原因:

  • 新建站處理故障期間,流量較低
  • 小區未啟用,導致零流量

 

3.零流量小區處理流程

   通過日常處理零流量小區的方法及經驗,總結如下排查及處理思路。可影響相應編號查詢下文判斷及解決方案。

 

零流量小區排查處理思路:

1.工程狀態核查

工程狀態只有在正常服務的狀態才能產生效能資料,因此發現零流量小區首要進行工程狀態核查,一般“等待開通”為現場臨時調測、“正在開通、正在運維”為交換代維後者是開站人員調測。面對不同的狀態與相關人員進行核查進而作出處理。

2.常規核查項

1.檢視小區狀態是否正常:

2.檢視路由、sctp是否正常:

目前我司裝置設定情況:

Sctp鏈路對端網元為MME,工作模式為客戶端共設有6條,全網統一配置,如果出現配置錯誤、缺失等會直接影響站點業務:

SCTP鏈路工作模式

對端IP地址1

對端IP地址2

對端網元型別

SCTP鏈路建立狀態

執行狀態[TD-LTE專用]

SCTP鏈路有效性[TD-LTE專用]

客戶端

100.70.254.1

100.70.254.2

MME

與對端連線成功

正常

有效資料

客戶端

100.70.254.3

100.70.254.4

MME

與對端連線成功

正常

有效資料

客戶端

100.70.254.5

100.70.254.6

MME

與對端連線成功

正常

有效資料

客戶端

100.70.254.9

100.70.254.10

MME

與對端連線成功

正常

有效資料

客戶端

100.70.254.11

100.70.254.12

MME

與對端連線成功

正常

有效資料

客戶端

100.70.254.13

100.70.254.14

MME

與對端連線成功

正常

有效資料

OMT側位置及截圖:

3.路由關係核查

610版本升級後基站配置到MME及SGW的路由掩為一條,如果路由缺失會全部ERAB會建立失敗,進而引起零流量,如下配置情況:

 

對端IP型別

對端IP網段地址

對端IP掩碼

閘道器IP地址

備註

IPv4

100.70.0.0

255.255.0.0

100.70.23.129

網管IP與基站IP相對應

如上所示,基站IP為100.70.23.138,閘道器IP地址前三位一致,最後一位按照如下表進行設定,如本週基站IP末尾為138,在“130-193”段,因此閘道器最後設定為129.最終此站點閘道器IP地址為100.70.23.129.

 

業務IP末尾

閘道器末尾

1-65

1

66-129

65

130-193

129

194-255

193

 

LMT位置截圖:

4.CRS核查

目前crs設定情況為巨集站統一設定為15,室內站點統一設定為9,集團管控引數。有時候因其它原因臨時調整為-15,此種情況等於小區去啟用。小區最大發射功率一般不做修改。巨集站設定為460、室分設定為460或者390.

如下LMT位置截圖:

5.效能統計項核查

正常情況:

異常情況:(詳情如下,可參考附件原文預警情況)

產品預警【2015】002-YJ-TDL_週期性測量任務導致北向缺數問題, OMC在V6.00.00.08版本和V6.00.10.10版本對週期性測量任務的組別和索引號做了一一對應的關係,例如R016組的索引號就是16,但在之前的版本中索引號是隨機取的,導致如果升級608和610版本後會導致索引號重複而週期性測量任務無法下發的問題

場景一:歷史遺留問題

歷史以後問題分版本給出解決方案:

  1. V6.00.00.08版本和V6.00.10.10版本

採取分批使用輪訓工具的方法操作,每批100站方式輪訓工具刪除的

具體步驟:

1>、使用輪訓工具刪除基站的週期性測量任務,刪除方法參見《【2014】056-TZ-TDL_基站升級到V6.00.00.08版本後出現KPI指標為0的方案解決【技術通知單】》

2>、同步刪除了週期性測量任務的基站的配置資料

3>、同步預定義效能計劃任務

場景二、新開站問題

參考預警附件,在此不做說明。

 

3告警類

如下告警均有可能造成小區業務異常,因此在故障處理中如下告警優先順序有必要提升:

告警名稱

告警編號

是否可能產生零流量

小區降質

1017000

NEA和網元斷連

31000

基站掉電通知

1104000

小區退服

1018000

射頻單元不在位告警

1021000

單通道IOT異常

1099000

本地小區建立失敗

1020000

單板不在位告警

1006000

處理器故障

1100000

射頻單元駐波比嚴重告警

1155000

 

4室內覆蓋問題

如果室內小區測試正常,但是存在如下問題:

  1. 室外巨集站訊號較強。
  2. 佔用室外巨集站訊號無法切換至室內小區。

可通過修改A2門限改善情況,適當的增加室外巨集站A2門限,是使用者儘早的切換至室內小區。

但是造成此種問題的根本原因還是室內外覆蓋的不合理,可通過調整天饋、整改室內系統等手段改善覆蓋。

 

5.使用者較少導致

可通過觀察RRC最大使用者數、RRC平均使用者數以及流量情況進行後臺初步判斷,對疑似使用者較少的場景結合2、3G流量及使用者情況進行觀察。最後到現場進行實測觀察覆蓋場景。

一般情況下如荒山、農田、工地、沒落景區等出均可能導致零流量。

 

針對此種情況可適當調整天饋方位角,將站點覆蓋儘量轉移至存在使用者的地方,或者通過農村覆蓋場景技術(8t8r、16t16r)增加小區覆蓋範圍,儘量減少零流量產生機會。

6.工程問題

青島發現個別站點代維在排障過程中將RRu和天饋臨時放在機房內的情況,如果後臺檢視小區狀態正常,現場測試無訊號,或者訊號覆蓋異常非常弱的情況,可在機房處測試是否訊號較強。遇到此種問題可追責代維責任。

7.掛資源問題導致

基站610版本目前已發現4類掛資源問題,會導致使用者在當前小區接入失敗,或者從其他小區切換到當前小區失敗,短時間造成KPI嚴重惡化。所有掛資源導致的問題現象表現一致:

    

1.現場發現的集中典型表現

  • 後臺觀察小區狀態正常。
  • 現場測試無訊號。
  • 後臺檢視存在實時使用者。
  • 流量統計為0(有時候可能存在流量,兩種情況均存在)
  • 按照15分鐘力度進行KPI監控,重點關注RRC請求次數及切換請求次數。如果發現短時間存在大量請求次數,則通過cdl進行統計失敗情況。
  • 外場投訴(一般都是之前正常,然後突然就不行了,站下無訊號。)
  • 周邊鄰小區切換到目標小區失敗,原因是:目標小區無可用的無線資源。

 

2. 掛資源問題和實際使用者數滿的區別

1、出現掛資源後及時查詢使用者數,掛資源和使用者數沒有直接聯絡,使用者數很少的情況下,也會出現掛資源。

真實使用者數滿之後導致的資源分配失敗分析指導如下,現場初步分析時要跟掛資源問題分開。

未開啟接納控制,使用者數滿後,是ERAB建立失敗;

開啟接納控制時,使用者數滿後,是RRC拒絕;

 

3.掛資源問題分類

序號

型別

bug號

問題現象

排障手段

1

型別1:掛例項

DTMUC00254038

CDL異常流程判斷:對應異常日誌時間點前後,出現終端重建立到目標基站其它小區,等待重配置完成時候,核心網觸發上下文釋放流程。多見於S1切換入後發生重建立。

復位基站

基站異常日誌判斷(3條告警):

1、連結串列管理出錯(告警編號10916,附加資訊File:/misc_link_base_func.c,Line:57, Key Parameters:)

2、獲取連結串列空閒節點失敗(告警編號10901,附加資訊File:/misc_com.c,Line:353, Key Parameters:)

3、分配UE例項失敗(File:/rrm_rbc_elemproc,Line:2333, Key Parameters:943,305,2,65535)等告警

注:由於版本不同,Line可能略有偏差

2

型別2:掛ue_index

DTMUC00252329

CDL異常流程判斷:對應異常日誌時間點前後,存在較多的切換的重建立後重配置失敗流程.

刪建小區

基站異常日誌判斷

檢視LMT異常告警,存在Crnti資源分配失敗或者UE在小區內索引分配失敗的告警;

3

型別3:掛ue_index

DTMUC00250612

CDL異常流程判斷:此問題多出現於caps較大的站點,主要是大業務量站點存在較多使用者反覆接入。

刪建小區

基站異常日誌判斷:

檢視LMT異常告警,有UE在小區內索引釋放失敗的告警(File:/rrm_rbc_elemproc.c,Line:30585, Key Parameters:小區索引,Ue在小區內索引,Ue在基站內索引)

注:由於版本不同,Line可能略有偏差

4

型別3:掛L2定時器

DTMUC00257382

CDL異常流程判斷:信令CDL中檢視L2的訊息(RRC-MAC),存在輔小區刪鏈訊息RRCMAC_SCELL_RL_DELETE_REQ,導致L2掛了定時器,此問題對初始接入使用者的上行同步產生影響,進而影響了上行傳輸的成功率。問題出現後的現象是基站未收到RRC連線完成或者重配置完成。此問題原因是610版本未配置CA的小區異常走入了CA流程,導致L2定時器掛起。

復位基帶板

基站異常日誌判斷

1、 UE索引非法 (告警編號10555,附加資訊:告警解釋:收到引數錯誤的訊息,對業務的影響的詳細描述:隨機接入失敗)。

2、 L2時鐘處理錯誤(告警編號10509,附加資訊告警子原因:11:重啟TATT定時器失敗

 

不懂的可以加我的QQ群:656187009(LTE-5G學習交流群) 歡迎你的到來哦,看了博文給點腳印唄,謝謝啦~~ 

相關文章