2024年1月20日发(作者:)

TEMP_OVER告警

告警解释

TEMP_OVER为单板工作温度越限告警。当系统检测到单板的工作温度超过所设置的温度上限值或低于所设置的温度下限值时,就会上报该告警。

告警属性

告警级别

重要

告警参数

告警类型

设备

在网管中浏览告警时,选中该告警,在“告警详细信息”中会显示该告警的相关参数。告警参数的格式为“告警参数(16 进制): 参数1 参数2…参数n”。每个参数的含义说明参见下表。

参数名称

参数1

参数含义

对于交叉时钟板,固定为0x01。

对于其他单板,代表单板工作温度越限类型。

0x01表示单板工作温度越上限。

0x02表示单板工作温度越下限。

参数2、参数3 对于交叉时钟板,固定为0x01。

参数4 对于交叉时钟板,代表单板工作温度越限类型。

bit[0] = 1表示单板工作温度越上限。

bit[1] = 1表示单板工作温度越下限。

bit位为0表示温度正常。

对系统的影响

单板工作温度过高(低),致使系统处于高危状态。在此状态下长期运行,有可能引起误码,业务中断等问题,应及时处理。

可能原因

告警TEMP_OVER产生的可能原因如下:

 原因1:防尘网积累灰尘太多。

原因2:风扇停止工作。

原因3:制冷(热)设备故障,导致环境温度过高(低)。

原因4:单板故障。

原因5:温度告警上下限设置不符合实际情况。

处理步骤

1. 原因1:防尘网积累灰尘太多。

a. 检查防尘网上积累的灰尘是否过多而导致散热不及时。可将手置于风扇出风处感觉出风的温度和出风是否顺畅。

b. 若因防尘网被堵塞而影响散热效果,取出并清洁防尘网。

a. 查询告警是否消除。若告警未消除,转2。

2. 原因2:风扇停止工作。

a. 检查子架风扇运行状态。

b. 查询告警是否消除。若告警未消除,转3。

3. 原因3:制冷(热)设备故障,导致环境温度过高(低)。

a. 检测机房环境温度。如果高于45℃或者低于0℃,则使用制冷(热)设备降低或者提高环境温度。

说明:TEMP_OVER告警上报后,为了防止告警抖动,在单板温度降(升)到温度上(下)限5摄氏度后告警才会消失。

b. 查询告警是否消除。若告警未消除,转4。

4. 原因4:单板故障。

a. 检查单板温度芯片是否损坏,可以查看网元是否存在CHIP_ABN告警。若存在,更换产生告警的单板。

b. 查询告警是否消除。若告警未消除,转5。

5. 原因5:温度告警上下限设置不符合实际情况。

a. 确认单板查询温度上下限设置和单板目前的温度,判断告警是否误报。

b. 查询告警是否消除。若告警仍未消除,可联系华佳慧工程师位处理。