2024年4月22日发(作者:)
(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(21)申请号 CN2.8
(22)申请日 2013.06.08
(71)申请人 烽火通信科技股份有限公司
地址 430074 湖北省武汉市东湖开发区关东科技园东信路5号
(72)发明人 王苏
(74)专利代理机构 北京捷诚信通专利事务所(普通合伙)
代理人 魏殿绅
(51)
(10)申请公布号 CN 103326897 A
(43)申请公布日 2013.09.25
权利要求说明书 说明书 幅图
(54)发明名称
一种分布式计算环境通用监测装置
与失效检测方法
(57)摘要
一种分布式计算环境通用监测系
统,包括,连通性监测系统,其包括设置
于客户端上的连通性监测模块、设置于服
务器上的连通性应答模块,以及连接连通
性监测模块与连通性应答模块的连通性监
测通道,且所述连通性监测系统用于检测
网络互连环境或服务器是否连通;服务有
效性监测系统,所述服务有效性监测系统
包括设置于客户端上的心跳监测模块、设
置于服务器上的心跳应答模块以及连接心
跳监测模块与心跳应答模块的心跳监测通
道,所述服务有效性监测系统用于检测服
务器是否失效。避免人工干预与故障判断
的低效与迟滞,充分发挥集中式中央局大
型设备的能力,提高其可用性,保障运营
商的投资效益。
法律状态
法律状态公告日
法律状态信息
法律状态
权 利 要 求 说 明 书
1.一种分布式计算环境通用监测系统,其特征在于:包括,
连通性监测系统,其包括设置于客户端上的连通性监测模块、设置于服务器上的连
通性应答模块,以及连接连通性监测模块与连通性应答模块的连通性监测通道,且
所述连通性监测系统用于检测网络互连环境或服务器是否连通;
服务有效性监测系统,所述服务有效性监测系统包括设置于客户端上的心跳监测模
块、设置于服务器上的心跳应答模块以及连接心跳监测模块与心跳应答模块的心跳
监测通道,所述服务有效性监测系统用于检测服务器是否失效。
2.如权利要求1所述的一种分布式计算环境通用监测软件装置,其特征在于:所述
连通性监测模块周期性发出连通性检测命令,若所述连通性应答模块多个周期未应
答,则判断网络互连环境或服务器未连通。
3.如权利要求1所述的一种分布式计算环境通用监测软件装置,其特征在于:所述
心跳监测模块发起有效性检测命令,若所述心跳应答模块在预设时间内未应答,则
判断服务器失效。
4.如权利要求1所述的一种分布式计算环境通用监测软件装置,其特征在于:所述
分布式计算环境通用监测软件装置还设有机框互连机构。
5.如权利要求4所述的一种分布式计算环境通用监测软件装置,其特征在于:所述
机框互连机构为用于插设服务器板卡的机框背板,,所述机框背板设有用于检测服
务板卡是否连接的检测元件。
6.一种使用权利要求1-4任一项所述分布式计算环境通用监测软件装置的失效检测
方法,其特征在于:所述失效检测方法包括以下两 任务:
任务一:连通性监测系统周期性监测网络互连环境或服务器是否连通,服务有效性
监测系统周期性监测服务器是否失效;
任务二:
A.客户端发出命令,为接受命令答应等待一个时间片,检查是否收到服务器应答,
若收到,则继续执行命令;若未收到,则进入B;
B.检测相应周期内连通性应答模块是否有应答,若连通性应答模块有应答,则进入
步骤C,若连通性应答模块无应答,则命令超时;
C.检测心跳应答模块是否有应答,若心跳应答模块有应答,则返回步骤A,若心跳
应答模块无应答,则命令超时。
7.如权利要求6所述的失效检测方法,其特征在于:所述任务一与所述任务二并发
执行。
8.如权利要求6所述的失效检测方法,其特征在于:命令超时时,所述客户端转移
到其它冗余服务或暂停。
说 明 书
【技术领域】
本发明涉及一种分布式计算环境通用监测软件装置与失效检测
可适用于无人值守的命令应答处理和批量命令自动处理。
【背景技术】
对于基于网络通信的客户机-服务器软件系统,包括基于互连网
式客户-服务系统,以及基于机框主板的插板式主控-线卡设备,
客户与服务交互的网络分布式特征,例如在无源光网络(PON)
入领域中,大量使用了机框插卡式设备,特别是在数据通信网
网不断扁平化的趋势下,局端设备因局所合并而使之要承载更
户接入,而业务的配置与发放都需要通过客户机向服务器下达
批量命令而实现的,设备开通和重启过程中需要在无人值守条
成批量命令执行而自动恢复先前保存的配置,这些处理过程与
验息息相关,直接影响着服务质量,另一方面,网管需要获取
行的状态,采集设备性能数据,来实现故障管理,也是通过向
出命令的方式实现的。机框插卡式设备需要承载更多用户,又
证其可用性高达99.99999%,因而设备的关键部件需有主备冗
务板卡的插槽也需增多,以支持更多的接入用户。机框
常由主控板、多个线卡和辅助板卡组成,前者要求主备
板与业务板卡(线卡)之间就是客户机与服务器的关系,
提供大量插槽,板卡通过网络实现互连,是一种典型的
分布式计算的命令执行环境。
对于分布式计算环境的客户机与服务器系统,客户机向服务器发
来取得服务器的应答,当互连环境、网络故障或服务器失效时,
方法,
的分布
都具有
宽带接
与接入
多的用
命令及
件下完
用户体
设备运
设备发
要求保
余,且支持业
插卡式设备通
冗余,而主控
机框底板通常
送命令
会影响
命令请求和应答的流程,特别是当自动配置命令批量执行过程
因中间命令的阻碍影响整个处理事务,因此需要一种系统框架
方法实现容错,保证处理流程的顺畅。
附图1为现有技术中命令请求-响应过程,对于各种命令交互情
括批量化命令处理情况,会出现命令响应处理过程延时差异很
有因服务模块失效而使命令响应处理过程无限延长而无应答结
因环境故障使应答结果无法传递,从而导致命令结果接收等待
限制等待,对客户模块命令交互特别是自动批量命令处理产生
响。若命令结果接收等待过程人为设定超时门限,以命令响应
程最长延时为准,则因服务模块计算环境的可变性而难以确定,
可能因服务模块失效而严重影响批量命令执行。从另一角度看,
令处理过程命令响应处理过程延时差异大,命令结果接收等待
待时间需按最长时间来预设,另外,网络通信通道可能出现故
服务模块故障失效,都会导致客户模块收不到应答。若按最长
待,则可能因难以判断故障而进入盲目等待:等待时间设置太
致客户模块忽略了服务模块的有效应答,等待时间设置过长而
模块的有效性与可用性判断迟滞,由此会导致系统命令处理效
【发明内容】
本发明的目的在于提供一种分布式计算环境通用监测软件装置
检测方法,其可以避免盲目等待,避免有效性与可用性判断迟
高系统命令处理效率。
本发明提供一种分布式计算环境通用监测软件装置,其特征在于:
中,会
和处理
况,包
大,还
果,或
过程无
严重影
处理过
同时也
由于命
过程等
障,或
时间等
短会导
使服务
率降低。
与失效
滞,提
其包括,
一连通性监测系统,所述连通性监测系统包括设置于客户端上的
监测模块、设置于服务器上的连通性应答模块以及连接连通性
块与连通性应答模块的连通性监测通道,且所述连通性监测系
检测网络互连环境或服务器是否连通;
一服务有效性监测系统,所述服务有效性监测系统包括设置于客
的心跳监测模块、设置于服务器上的心跳应答模块以及连接心
模块与心跳应答模块的心跳监测通道,所述服务有效性监测系
检测服务器是否失效。
在上述技术方案的基础上,所述连通性监测模块周期性发出连通
命令,若所述连通性应答模块多个周期未应答,则判断网络互
或服务器未连通。
在上述技术方案的基础上,所述心跳监测模块发起有效性检测命
所述心跳应答模块一定时间未应答,则判断服务器失效。
在上述技术方案的基础上,所述分布式计算环境通用监测软件装
有机框互连机构。
在上述技术方案的基础上,所述机框互连机构为用于插设服务器
置还设
令,若
性检测
连环境
户端上
跳监测
统用于
连通性
监测模
统用于
板卡的机框背板,所述机框背板设有用于检测服务板卡是否连
测元件。 接的检
本发明还提供一种使用所述分布式计算环境通用监测软件装置
检测方法,所述失效检测方法包括以下两任务:
的失效
任务一:连通性监测系统周期性监测网络互连环境或服务器是否
服务有效性监测系统周期性监测服务器是否失效;
任务二:
A:客户端发出命令,为接收命令应答等待一个时间片,检查是
服务器应答,若收到服务器应答则继续执行命令,若未收到服
答,则进入步骤B;
B:检测相应周期内连通性应答模块是否有应答,若连通性应答
应答,则进入步骤C,若连通性监测系统无应答,则命令超时;
C:检测心跳应答模块是否有应答,若心跳应答模块有应答,则
骤A,若心跳应答模块无应答,则命令超时。
在上述技术方案的基础上,所述任务一与任务二并发执行。
在上述技术方案的基础上,命令超时时,所述客户端暂停或转移
冗余服务。
与现有技术相比,本发明通过连通性监测系统,检测网络互连环
务器是否连通,通过服务有效性监测系统检测服务器是否失效,
络互连及机框设备中无人值守的大批量配置命令和设备状态
好地执行,快速定位故障及配套处理使命令执行的效率
免人工干预与故障判断的低效与迟滞,充分发挥集中式
【附图说明】
连通,
否收到
务器应
模块有
返回步
到其它
境或服
可使网
读取命令能更
大大提升。避
中央局大型设备的能力,提高其可用性,保障运营商的投资效益。
图1为现有技术中命令请求-响应过程示意图;
图2为本发明系统架构和功能模块图;
图3为本发明失效检测方法流程图。
【具体实施方式】
请参考图2,图2为本发明系统架构和功能模块图。客户端103
器104之间通过命令通道111连接。分布式计算环境通用监测
连通性监测系统和服务有效性监测系统,所述连通性监
置于客户端上的连通性监测模块105、设置于服务器上
106以及连接连通性监测模块105与连通性应答模
通道112,连通性监测系统用于检测网络互连环
有效性监测系统包括设置于客户端上的心
务器上的心跳应答模块102以及连接心跳
的心跳监测通道110,服务有效性
连通性监测模块105周期性发出连通性检测命令,若连通性应答
106多个周期未应答,则判断网络互连环境或服务器104未连通。
报故障并停止命令,或客户端103转至其它冗余服务。
心跳监测模块101发起有效性检测命令,若所述心跳应答模块102
间未应答,则判断服务器104失效,停止命令,或客户端103
当存在机框互连机构108时,机框互连机构108上设有检测元件。 检测元
转至其它冗余服务。
一定时
模块
此时上
和服务
软件装置包括
测系统包括设
的连通性应答模块
块106的连通性监测
境或服务器是否连通。服务
跳监测模块101、设置于服
监测模块101与心跳应答模块102
监测系统用于检测服务器是否失效。
件检测机框互连机构108是否正确连接。在本实施例中,机框
为机框背板,为服务器板卡104提供插槽。检测元件检
否安装。若服务器104板卡未安装,则判断服务
下面介绍使用本发明分布式计算环境通用监测软件装置检测进
检测的方法。该检测方法包括以下两并发执行的任务:
任务一:连通性监测系统周期性监测网络互连环境107或服务器
否连通,服务有效性监测系统周期性监测服务器104是否失效。
监测系统中的连通性监测模块105周期性发出连通性检测命
应答模块106多个周期未应答,则判断网络互连环境或
任务二:
A:客户端103发出命令后接受等待一个时间片,并检查是否收
器104应答,若收到服务器104应答则继续执行命令,若未收
应答,则进入步骤B;
B:检测相应周期内连通性应答模块106是否有应答,若连通性
块106有应答,则进入步骤C,若连通性应答模块106无应答,
命令超时;
C:检测心跳应答模块102是否有应答,若心跳应答模块102有
则返回步骤A继续等待下一个时间片,若心跳应答模块102无
互连机构108
测服务器104板卡是
器104失效。
行失效
104是
连通性
令,若连通性
服务器104未连通。
到服务
到服务器104
应答模
则判断
应答,
应答,则命令超时。当命令超时,则可发出错告警信号而暂停
理,或按预设转移到其它冗余服务进入发送-接收命令的流程。命令处
本发明分布式计算环境通用监测软件装置与失效检测方法可较快
地检测出命令执行过程中相关的故障和失效情况,避免当连通
务失效时长时间超时等待所带来的资源浪费,以及不能区分故
的盲目维护工作。快速定位故障及配套处理使命令执行的效率
升。避免人工干预与故障判断的低效与迟滞,充分发挥集中式
大型设备的能力,提高其可用性,保障运营商的投资效益。
速有效
性或服
障原因
大大提
中央局


发布评论