2023年11月26日发(作者:)

基站升级异常场景总结及后处理

本文档针对升级过程中的下载、解压、同步和激活阶段的异常场景进行总结,并说明禁止操

作及提供应对方法,供阅读人员参考。欢迎阅读者补充未涵盖情况

一、 BBU软件升级失败

本节描述升级失败的常见场景及处理方法,可作为升级过程中异常情况解决的参考。

特殊情况:aPCLMT安装目录的磁盘空间不足,LMT-B版本太旧会导致拆包失败,无法

进行升级。b、下载冷补丁包时与基站运行版本无依赖关系不会进行下载(但会先拆包再判

断是否是依赖版本关系)

1 载失败

原因1ramDisk磁盘空间不足

记录S1链路异常信息、IP抓包日志、CDLMR日志文件较大,或板卡运行较长时间存在

其他程序残留导致

现象1:在LMT上使用文件管理功能拖BBU大包下载失败。查看基站软件包运行配置节点

操作已结束,升级状态为“正在下载”完成100%且升级失败槽位信息填写了基站支持的所

有槽位。

现象2:文件升级进度条显示已完成,但控制台打印下载失败。12表示下载流程已完成

LMT的控制台打印如下日志信息

2015-01-20 15:10:00 Start BBU Software version [EMB5116_V6.00.10.10.14] Download!

变更通知(1111:172.27.245.92):

2015-01-20 15:10:00 (修改): SNTP最近同管理站的同步时间(sntpLastSynchronizedTime), 实例0, 值变为:

2015-01-20 15:08:44

SET命令响应(1111:172.27.245.92):

2015-01-20 15:10:00 2015-01-20 15:10:00 被管对象: 软件包名称(swPackPlanPackName)实例1 ,值为:

;

2015-01-20 15:10:00 被管对象: 厂家信息(swPackPlanVendor)实例1 ,值为: null;

2015-01-20 15:10:00 被管对象: 软件包版本(swPackPlanVersion)实例1 ,值为: EMB5116_V6.00.10.10.14;

2015-01-20 15:10:00 被管对象: 软件包自动下载标志(swPackPlanDownloadIndicator)实例1 ,值为: 立即下

;

2015-01-20 15:10:00 : (swPackPlanScheduleDownloadTime)1 ,:

2015-01-20 15:10:00;

2015-01-20 15:10:00 : (swPackPlanDownloadDirectory)1 ,:

D:/version1;

2015-01-20 15:10:00 被管对象: 激活标志(swPackPlanActivateIndicator)实例1 ,值为: 立即激活;

2015-01-20 15:10:00 被管对象: 软件包定时激活或去激活时间(swPackPlanScheduleActivateTime)实例1 ,

: 2015-01-20 15:08:26;

2015-01-20 15:10:00 被管对象: 补丁包依赖版本(swPackPlanRelyVesion)实例1 ,值为: null;

2015-01-20 15:10:00 被管对象: 固件激活标志(swPackPlanFwActiveIndicator)实例1 ,值为: 激活;

2015-01-20 15:10:00 被管对象: 基站软件拆包个数(swPackPlanSubPackNumber)实例1 ,值为: 3;

普通信息(1111:172.27.245.92):

2015-01-20 15:10:04 Download BBU Software(Part1) finished! ErrorCode = 100

事件通知(1111:172.27.245.92):

2015-01-20 15:10:04 收到文件上传/下载结果事件( 文件 D: 下载失败错误类型为:其

)

告警提示(1111:172.27.245.92):

2015-01-20 15:10:04 基站<网元标识(逻辑ID:5054>产生编号10002事件类告警:基站软件包更新失败 (

生模块:OM_SFT;告警值:1(软件包下载失败);附加信息:NULL;告警次数:1)

重要信息(1111:172.27.245.92):

2015-01-20 15:10:04 Download BBU Software [] is failed!

普通信息(1111:172.27.245.92):

2015-01-20 15:10:04 No other BBU Software Need Active!

变更通知(1111:172.27.245.92):

2015-01-20 15:10:07 (修改): 基站软件拆包个数(swPackPlanSubPackNumber), 实例1, 值变为: 1

现象3查询主控板的ramDisk或磁盘内存空间不足(空闲空间放不下part包或者解压文件)

解决方法:

使用OSP命令删除ramDisk中的冗余文件或复位基站,重新托包下载(若为CDL日志上传导

致,需要关闭所有CDLMR日志生成开关)。无禁止操作

原因2FTP Server程序未打开或ftp任务异常

由于FTP Server程序异常无法建立ftp传输进程,或杀毒软件、防火墙屏蔽Win7ftp程序,

或上传MRftp进程未释放ftp队列资源导致下载BBU包失败

现象1:托包下载控制台打印失败信息

2015-01-20 15:40:30 Start BBU Software version [EMB5116_V6.00.10.10.14] Download!

告警提示(1111:172.27.245.92):

2015-01-20 15:40:30 基站<网元标识(逻辑ID:5054>产生编号10002事件类告警:基站软件包更新失败 (

生模块:OM_SFT;告警值:1(软件包下载失败);附加信息:NULL;告警次数:1)

普通信息(1111:172.27.245.92):

2015-01-20 15:40:31 Download BBU Software(Part1) finished! ErrorCode = 4

重要信息(1111:172.27.245.92):

2015-01-20 15:40:31 Download BBU Software [] is failed!

普通信息(1111:172.27.245.92):

2015-01-20 15:40:31 No other BBU Software Need Active!

现象2:系统右下角图标区无FTP Server程序图标(误关)

现象3FTP Server软件启动并运行正常情况下,无法完成版本包的传输下载,进度条不开

始或者卡在某一进度不再刷新,同时基站版本目录中未将版本包中文件下载完全(ftp进程

满)

现象4:测试线出现多次XP系统网卡异常,导致LMT文件上传、下载功能失效(重新启用

网卡可以解决)

解决方法:

LMT安装目录下重新打开程序关闭Win7操作系统防火墙或杀毒软件对

LMTftp程序设置为信任;通过OSP命令关闭主控板任务列表ftp进程,重新拖包下载,

无禁止操作

原因3:由于版本包存放目录过深或路径存在非法字符

现象:LMT会弹出提示框,说明路径超限

解决方法:

版本存放路径过深(超255字符)或存在非法字符&<>、回车等,可通过-B的提示信息

确认修改,未开始下载,下载的前置条件问题。

原因4:大包拆包个数小于升级配置信息设置个数

软件大包实际拆包个数小于基站升级配置信息设置的个数会返回下载失败,如果多于配置信

息设置个数,会下载成功,但是实际版本目录中会丢失某些文件,可能导致系统运行异常

现象1:基站软件包运行配置显示“正在下载”、完成100%且失败板卡列表为所有槽位

现象2LMT控制台打印如下信息

2015-01-20 18:37:26 收到文件上传/下载结果事件( 文件

E:610banbenEMB5116_TD-LTE_V6.00.00.10.24_20150114(V6.00.10.10.24)压缩包

下载失败错误类型为:源文件不存在或目的文件创建失败 )

普通信息(1111:172.27.245.92):

2015-01-20 18:37:26 Download BBU Software(Part2) finished! ErrorCode = 7

告警提示(1111:172.27.245.92):

2015-01-20 18:37:27 基站<网元标识(逻辑ID:5054>产生编号10002事件类告警:基站软件包更新失败 (

生模块:OM_SFT;告警值:1(软件包下载失败);附加信息:NULL;告警次数:1)

重要信息(1111:172.27.245.92):

2015-01-20 18:37:27 Download BBU Software [] is failed!

解决方法:

若为程序问题,可以手工修改升级配置信息(对象树-基站软件包运行配置-右键修改基站软

件包规划信息)与实际拆包个数一致,确定后重新下发下载命令;若人工误操作导致已拆包

被删除或修改,可重新拖包下载。

禁止操作:若第一个小包中和主控板si均未成功下载/ata2/VER/RUNNING/SW下无

版本文件)到基站中禁止复位基站

原因5:消息队列满导致下载消息丢失

由于消息队列满导致的丢消息,此场景下,无法完成版本包的下载

现象1:拖包下载后,进度条不更新进度,OSP上无文件包传输进度打印,版本目录文件无

法进行上传下载

解决方法:

由于基站侧消息队列满,导致未处理升级任务,无法完成升级。解决办法为先结束本次操作,

再次拖包升级,或者复位主站后重新拖包升级。无禁止操作

原因6:下载升级过程中主站看门狗复位

现象1:拖包下载过程中主站自动复位,LMT断链,导致下载未完成

现象2:基站重新启动后,上传重要过程日志查看复位原因。日志中记录了复位原因是看门

狗复位,打印如下

OmKeyLog -

Sw last reset reason:nosw reset reason

Hw last reset reason:watch dog reset

现象3磁盘空间不足,查看LMT对象树节点-物理设备-机架-板卡-板卡存储,主控板ramDisk

内存小于33M/ata2下无法放下解压后的程序文件

解决方法:

清除磁盘空间或ramDisk中冗余文件,关闭CDLMR等日志上传开关,重新拖包下载,无

禁止操作

原因7:丢trap导致LMT一直等待下载完成消息

现象1:下载进度条停留在98%,一直不显示完成(基站软件包运行配置)

现象2:使用文件管理功能查看主控板版本目录,版本包已全部下载到SW文件夹下

现象3:若开启抓包工具,没有收到下载完成的Trap

解决方法:

直接手动复位基站即可,无禁止操作

2 压失败

基站ramDisk磁盘空间不足,ata2版本目录磁盘空间不足,解压缩工具调用异常导致解压失

原因1/ata2磁盘空间不足

现象1LMT对象树节点基站软件包运行配置查看升级状态为“正在解压缩”完成100%

且失败列表显示所有支持的板卡

现象2:历史告警中存在1256磁盘空间不足告警(附加信息为DevName=/ata2

现象3:解压失败时,版本安装目录为空,即/ata2/VER/RUNNING/SW下无任何文件

解决方法:

删除/ata2目录下的冗余文件,并关闭MRCDL日志上传开关,重新拖包下载

禁止操作:禁止复位基站,解压失败后版本目录为空,复位后无法完成启站

原因2:调用解压缩工具失败

现象1:下载完part1LMT直接上报解压缩失败

现象2:使用OSP登陆主控板,查看任务列表,解压缩任务异常

解决办法:

重新拖包下载或复位基站后再拖包下载,禁止复位基站

3 步失败

原因1ini文件错误

由于ini文件损坏或内容错误,会导致同步失败(双模基站下载时有校验,TDL单模不校验)

一般为做包时压缩错误ini文件导致(实验室人为构造)。外场一般不会出现该问题。

现象1LMT对象树升级状态为“正在同步”进度为100%失败列表显示失败的槽位信息。

现象2LMT控制台打印同步失败的具体信息

解决方法:

将正确的ini文件重新下载到基站版本目录中,重新下发同步命令;或者重新拖正确的版本

包,再次进行升级流程。无禁止操作

原因2flashDev空间不足

升级过程下载成功后,基站程序自动进行主控板及接口板的SI同步,会由于板卡flashDev

空间不足导致同步失败。控制台会打印同步失败信息,主控板同步成功基带板同步失败会继

续激活基站。主控板同步失败会停留在同步阶段,等待人工干预

现象1:历史告警中存在1119文件拷贝失败告警及单板软件更新失败告警(关联告警)

现象2LMT控制台打印SI文件同步失败,控制台会打印下载si文件失败

现象3:相应槽位板卡同步失败

2015-01-22 15:58:30 基站<网元标识(逻辑ID:5062>产生编号1119故障类告警:文件拷贝失败 (产生模

:OM_SFT;告警值:255(无效);附加信息:Update file sct_led(0,0)!

;告警次数:1)

普通信息(91:172.27.245.91):

2015-01-22 15:58:30 Download BBU Software() Success!

普通信息(91:172.27.245.91):

2015-01-22 15:58:30 Start syn BBU software version[EMB5116_V6.00.10.10.23]!

告警提示(91:172.27.245.91):

2015-01-22 15:58:30 板卡<插槽:0>产生编号10003事件类告警:单板软件更新失败 (产生模块:OM_SFT;

告警值:3(单板软件copy失败);附加信息:NULL;告警次数:1)

2015-01-22 15:58:32 Start software automatic synchronization(0,0)!

普通信息(91:172.27.245.91):

2015-01-22 15:58:32 Start copy sct_ from ramDisk to flashDev(0,0)!

2015-01-22 15:58:35 Update file sct_led(0,0)!

普通信息(91:172.27.245.91):

2015-01-22 15:58:35 Software automatic synchronization failed(0,0)!

变更通知(91:172.27.245.91):

2015-01-22 15:59:08 收到通用事件( 事件类型: BBU程序激活结果; 结果: 失败; 事件产生源:eNB; 附加

信息: Syn failed![0,0]:failed!; 产生时间:2015-01-22 15:55:37; )

2015-01-22 15:59:10 Normal upgrade!

普通信息(91:172.27.245.91):

2015-01-22 15:59:10 Active process failed,reason is [Syn failed![0,0]:failed!]!

普通信息(91:172.27.245.91):

2015-01-22 15:59:10 Software syn failed!

解决方法:

对于磁盘中有垃圾文件同步失败情况:清除相应(主控)板卡flashDev空间的冗余文件,重

新手动下发激活命令或复位该板卡,重新加载程序;

对于SI文件过大同步失败情况:在主控板卡中通过OSP下载一个相对小的sctiplte_

件(二者相加小于16M,复位板卡重新同步成功后基站可正常运行。

禁止操作,根据具体提示原因,不要强制下载,不要删除同步失败板卡的SI,不要复位基站

(同步失败后复位基站,重启后由于SI文件过大,flashDev空间不足仍然会同步失败,此时

除基带板,其他所有板卡均处于故障状态,虽然小区状态仍正常管理状态,但监控和业务速

率均未处于主控管理状态,可能导致其他问题)

4 活失败

激活失败一般出现在共同激活场景,BBU包或者RRU包同步异常会导致下发激活命令失败,

根据上文描述,对具体同步失败场景进行修正即可重新激活,无禁止操作

5 级成功但缺少文件场景

使用LMT远程管理两个以上基站并同时升级BBURRU包时。具体现象为LMT管理两个基

A和基站B,在给基站A升级BBU软件的同时又给基站B下载RRU的软件包,而BBU

RRU软件包放在同一个文件夹下,导致后拆分的RRU包将BBU已拆分的part包覆盖,升级

成功后基站A主站侧缺少文件,因为下载的part包是后拆分的RRU包。

解决方法:

BBU包和RRU包放在不同文件夹下,重新拖包下载即可,无禁止操作

6 制开关打开导致升级失败场景

A 控制开关-协议栈抓包开关为打开状态进行拖包升级

B CDL整站级和小区级日志上传开关均打开

C MR整站级和小区级日志上传开关均打开

解决办法:

将相应开关在升级前关闭,升级成功后再打开。

二、针对升级过程中的任何异常情况请在后处理前提取公共

日志及主控板的1号和71号日志

三、附录

A 删除文件方法:SCTESCTA-IPRRU命令cmdrmf /ramDisk/filename

SCTA删除命令rm/ramDisk/filename

B OSP登陆主控板,敲i,打印出的tOmFileT进程为传输、解压版本包的OM任务名