2024年4月6日发(作者:)

HUAWEI

标题:

传输层问题导致E-RAB掉线率恶化

作者:**

故障类别:E-RAB掉线率恶化

问题描述:

某局点KPI指标监控,发现2014-06-09日早上08点开始,E-RAB掉线率开始恶化,最严重

时从0.20%恶化到3.28%,如下表所示:

E-RAB掉

日期 时间

线率分子

06/07/2014

06/08/2014

06/09/2014

06/07/2014

06/08/2014

06/09/2014

06/07/2014

06/08/2014

E-RAB掉

线率分母

1297113

1246162

1557959

1475105

1416622

1722080

1549947

1509593

1787391

E-RAB掉

线率

0.16%

0.17%

0.91%

0.22%

0.22%

3.28%

0.20%

0.19%

2.36%

8:00:00

8:00:00

8:00:00

9:00:00

9:00:00

9:00:00

10:00:00

10:00:00

10:00:00

2077

2064

14148

3173

3059

56431

3159

2799

42140 06/09/2014

处理过程:

1 .发现E-RAB掉线率开始恶化后,首先提取E-RAB掉线原因,发现传输层问题导致的

E-RAB异常释放次数占比较大,9点过后达到95%左右,初步判断为传输层问题导致的E-RAB掉线

率恶化,具体统计如下;

E-RAB

日期 时间

掉线率分

E-RAB掉

线率分母

传输层问

题导致的

E-RAB异

常释放次

数(无)

传输层问

题导致掉

线占比

06/07/2014

06/08/2014

06/09/2014

8:00:00

8:00:00

8:00:00

2077

2064

14148

1297113

1246162

1557959

%

8.53

176

%

78.72

11137

%

51

2.46

加晶

文档名称文档密级

13.93

06/07/2014

06/08/2014

06/09/2014

06/07/2014

06/08/2014

9:00:00

9:00:00

9:00:00

10:00:00

10:00:00

10:00:00

3173

3059

56431

3159

2799

42140

1475105

1416622

1722080

1549947

1509593

1787391

442

%

821

26.84

54165

%

95.98

%

19.47

615

%

13.65

%

94.19

39692

%

382

06/09/2014

2 .该局点LTE网络的MME有两个,归属不同厂家,所以将E-RAB掉线次数按区域汇总,

发现**和**区域传输层问题导致的E-RAB异常释放次数较多,这两个区域的MME归属于同一个厂家,如下:

传输层问题

E-RAB掉

区域

线率

分子

E-RAB掉

线率

分母

598890

40963

334747

3523446

1851898

1671252

185155

1607734

11896

1965806

1425688

325448

导致的

E-RAB异常

释放次数

(无)

1037

698

1228

53822

2135

4202

274

3802

10

27908

4457

7899

1

2

3

4

5

6

7

8

9

1

0

1

1648

742

1706

59576

4801

7095

610

6372

36

30578

7352

8518

1

1

2

3 .确定问题MME后,对E-RAB掉线次数TOP小区进行GTPU信令跟踪,进一步定位问

题传输IP,如下图,找到接收的Erro门ndication消息,记录问题IP:

HUAWei

本次问题定位共找到4条IP,如下:

基站名

本站

IP

问题

IP

修理厂美化塔

-HLH

教师进修学校

-HLH

100.86.142.21

100.86.129.243

100.86.142.12

100.86.128.142

100.86.206.53

100.86.206.52

100.86.206.51

100.86.206.18

-HLH

中铁二院

-HLH

4 .将问题反馈到传输侧,然后传输侧对问题进一步定位分析,于2014-06-11日凌晨对问

题进行处理,02点过后E-RAB掉线率恢复正常,如下:

E-RAB掉线率分

时段

06/11/201400:00:00

06/11/201401:00:00

06/11/201402:00:00

06/11/201403:00:00

06/11/201404:00:00

06/11/201405:00:00

06/11/201406:00:00

06/11/201407:00:00

06/11/201408:00:00

06/11/201409:00:00

子(次)

11396

10489

986

181

738

518

520

2257

6416

3414

E-RAB掉线率分

母(次)

902723

767780

655178

622149

595542

609232

760487

1081395

1360916

1503448

E-RAB掉线率

1.26%

1.37%

0.15%

0.03%

0.12%

0.09%

0.07%

0.21%

0.47%

0.23%

问题根因:

传输层问题导致E-RA算常释放次数增多

解决方案:

传输侧处理问题传输IP。

建议总结:

KPI监控中经常会遇到指标恶化,遇到指标恶化可以从以下几方面入手,可以迅速的定

位问题原因:

1、查看TOP小区,分析TOP小区是否处于一片区域,计算TOP小区对全网指标的影响,排查是否由于TOP

小区导致指标恶化;

2、取指标恶化时间的告警,统计告警出现的个数,排查是否因为重大操作或故障导致

指标恶化;

3、取指标恶化原因值,比如:RRC建立失败原因,RAB建立失败原因,RAB异常释放

原因,切换失败原因等等,进一步定位是无线、传输还是核心网问题导致指标恶化。

LTE系统是扁平化的网络,从eNodeB直接经传输到核心网,传输层出问题会严重影响

到KPI指标,比如无线接通率,无线掉线率和切换成功率。一般RRC建立没有问题,而RAB

建立、RAB释放出现问题,基本可以排除是无线问题导致指标恶化,在问题定位排查后,

尽快协调传输,核心网一起分析定位。