2024年5月30日发(作者:)
第28卷第3期
2011年3月
计算机应用与软件
Computer Applications and Software
Vo1.28 No.3
Mar.20ll
基于IPMSG的银行业务自动监控系统的设计与应用
安继芳 李海建
(北京联合大学应用文理学院
(中国农业银行北京市分行
北京100191)
北京100083)
摘要 银行业务的发展导致系统维护工作量巨增,为了能够及时发现并解决异常情况,以免产生更大的不利影响,需要进行自
动监控、报警及报告。介绍了一种在AIX平台下,利用SHELL编码实现对前置系统重要性能指标进行监控,并利用开源的局域网通
讯工具IPMSG及时报警报告的具体应用。系统的实际应用使银行科技维护人员能够及时发现并解决问题,防范风险,提高了工作
效率。
关键词 AIX IPMSG银行业务 自动监控
DESIGNING AND IMPLEMENTING IPMSG.BASED BANKING BUSINESS
AUToMATIC MoNIToRING SYSTEM
An Jifang Li Haijian
(College ofArts and Sciences,Beijing Union University,Beijing 100191,China)
。(Agricultural Bank of China Belitng branch,Beiifng 100083,Chian)
Abstract The development of banking business leads to great increase in workload of system maintenance.In order to detect and resolve
anomalies in time,SO as not to have a greater negative impact,automatic monitoring,alarming and reporting are required.This paper pres-
ents a speciifc application on AIX platform.It uses SHELL coding to realize monitoring the important indexes of front systems,and uses
IPMSG,an open source LAN communication tool,to alarm and repo ̄timely.The practical application of this system enables the scientific
and technological maintenance staff at the banks to discover and resolve problerrrs in time,to prevent the risks,and to raise working efifciency.
Keywords AIX IPMSG Banking business Automatic monitoring
对异常情况实时报警,并对高峰时刻系统设置是否合理进行分
0 引 言
析,同时每天生成系统监控报告,统计前一天系统出现的故障次
数和时间,方便对故障的分析和研究。
随着银行业务的发展,布署在前置机上的应用系统越来越
多,包括机器本身的操作系统、数据库系统以及银行应用系统,
2 IPMSG简介
所涉及的技术人员也越来越多,维护人员所面对的系统信息量
以几何级数量增长,给维护工作带来了一定的压力。为保证系 信息发送采用IPMSG 2.06。IPMSG全称为IP Messenger,
统正常运行,及时发现各种异常情况,并在最短时间内解决以免
中文名为— 鸽传书”,是一款由H.Shirouzu(日本)开发和维护
产生更大的不利影响,需要对于前置系统重要性能指标(如
的用C语言编写的局域网聊天和文件传输工具。后来发展为
CICS、console、进程状态及空间占用情况等)进行监控。但正由
由很多志愿者共同开发出多种版本。它是一个小巧方便的即时
于所涉及的信息量巨大,管理员忙于这些指标的管理维护和监
通信软件,适合用于局域网内甚至广域网间进行实时通信和文
控,占用了技术人员不必要的精力,降低了银行科技部门的工作
档共享,特别是在局域网内传送文件/文件夹的效率很高。它基
效率。为此实现对应用系统关键性指标进行自动监控、报警及 于TCP/IP协议,可运行于多种操作平台(Windows/Mac/
报告将有助于技术人员及时发现并解决问题,防范风险,提高工
UNIX),并实现跨平台信息交流。
作效率
它具有很多优点,如数据通讯不需要建立服务器、直接在两
台电脑间通信和数据传输;支持文件及文件目录的传输;安全快
1 系统设计目标
捷以及小巧方便等。因此很多公司都采用它作为部门、公司内
部的IM即时通信工具。
本银行业务自动监控系统的设计目标是:在银行应用系统
运行过程中,及时发现关注的关键性指标的各种异常现象,对前
收稿日期:2009—09—18。安继芳,讲师,主研领域:信息管理与信
置系统的流量及关键进程进行监控,对空间占用情况进行监控,
息系统,网络系统管理,网络安全。
第3期 安继芳等:基于IPMSG的银行业务自动监控系统的设计与应用 301
目前CICS、console以及应用进程运行状态的监控是每分钟
3 系统特色
(1)实时监控,故障报警
执行一次;空间占用情况监控为每半小时一次。
4 AIX平台上的SHELL编码
以实时监控流程中进程的监控为例,实现如下
I、0W="date+%Y%Ill%d%H%M、
程序每隔一段时间(现为每分钟)扫描一次检查CICS状
态、console状态、各渠道产品进程,分析进程数目及渠道流量是
否正常,一旦发现异常,则发送~条信息到系统相关负责人的工
作机上,提示系统管理人员进行必要的处理。
程序每隔一段时间扫描一次系统管理人员指定的特定文件
psfile=”/home/ps.”NOW
系统空间占用情况,一旦发现该指定文件系统所已经使用的空
间超过系统管理人员设定的限制,则发送一条信息到系统相关
负责人的工作机上,提示系统管理人员进行必要的处理。注:目
前相关负责人的范围包括主机房运行监控人员(24小时)、系统
负责人、应用负责人及其部门领导(工作时间)。
实时监控示意图如图1所示。
图1实时监控流程
采用日志文件存放报警信息,状态采集程序获取进程状态、
CICS状态、应用状态以及文件系统空间大小,与按设定的规则
进行判断,若异常,则将异常项目及提示信息写入13志文件。对
日志文件大小进行判断,若不为0,即有报警信息,调用1PMSG
程序将报警信息发送到负责人的IPMSG上,提醒管理员及时解
决问题。
(2)定期扫描,每日报告
次13早晨统计前一天系统出现的故障次数和时问,生成系
统监控报告,方便对故障的分析和研究;在交易高峰时刻对前置
系统进行高密度(现在大概3~5秒一一次)扫描。扫描完成后进
行统计,生成一份反映该高峰时段的进程平均数和最高数,即渠
道流量的平均数和最高数;程序每隔一段时间扫描一次所有的
文件系统空问占用情况,如果文件系统所已经使用的空间超过
系统管理人员设定的限制,则写入当日的监控报告中,当日或第
二日,系统管理人员可以查看该监控报告,分析系统空间占用情
况,进行必要的策略调整。
(3)配置文件,便于扩展
所监控的对象即应用系统关键性指标及其阈值定义采用配
置文件方式,增加监控内容时只需对配置文件进行操作,而无需
修改程序,便于维护。
(4)自动执行,IPMSG发送
程序通过AIX系统本身crontab方式实现自动运行监控脚
本,达到定时或间隔一段时问的功能,通过monalert方式向
IPMSG(在系统管理员工作PC机或运行作业部监控机上运行)
传送报警消息。
ps—e>psfile
for i in"cat/home/pslist、
d0
]ineeount="grep—W—c i psfile、
iftest lineeouot——eq 0
then
pfinff”process:[错误警告]%s状态异常,联系相关人员[inactive]
%s\n”i NOW>>logname:
done
/home/monalert-f logname目标IP
以上SHELL编码就可以完成图1所示实时监控流程中,通
过ps获得进程数,对关注进程设定值进行判断,并将异常情况
写入日志文件,继而将日志文件发送到负责人的IPMSG上。
5应用效果
银行业务自动监控系统自投产以来,已涵盖多台主机:大前
置机,TULIP主机,部分周边小前置机(大额支付前置机MBFE
等);涵盖的应用系统包括:AIPS,卡业务系统,金融服务平台,
大额支付,等。监控内容目前主要包括:CICS状态,console状
态,应用进程状态,空问占用情况。
该系统在保障系统正常运行有着非常重要的现实意义。首
先,在故障发生的第一时间将报错信息实时报告负责人,由管理
员及时处理。目前实时监控报警信息同时发送系统管理员,应
用管理员和数据库管理员、各管理员都在第一时间内得到报警
信息,从各自负责的方向确定问题发生的原因及解决方法,有利
于问题的快速解决,使得故障时间隔大大缩短,在最短时间内恢
复正常。其次,监控系统在报警的同时,记录故障信息,并自动
生成报告。对故障报告的进一步分析,可确定下一步的监控目
标以及对应用系统参数进行调优,或提出应用程序修改建议。
应用监控系统的应用大大缩短我行13常运行工作中故障的
发现和处理时间,产生了巨大的科技保障效益。把更多的应用
系统信息可以量化并纳入监控系统中,以保证分行各应用系统
的稳定健康运行,给客户提供更完善优质的服务。
参考文献
[1]科钱.Unix Shell编程[M].3版.袁科萍,等译.北京:中国铁道工
业出版社,2004.
[2]IPMSG官方网站.http://www.ipmsg.or#index.htm1.en.
[3]UNIX管理系列编委会编.AIX系统管理与网络管理[M].北京:
中国人民大学出版社,2002.


发布评论