2023年12月7日发(作者:)
____________________________________电力系统及其自动化Power
System
&
Automation《电气自动化》2020年第42卷第6期变电站网络风暴故障案例的分析和处理李世群,宋巍,王i,郭飞,康莹(国网冀北电力有限公司检修分公司,北京102488)摘要:针对变电站网络风暴开展研究。首先分析了变电站网络风暴产生的机理,然后针对一起变电站网络风暴案例进行分析,以变
电站网络拓扑分析为基础,逐步介绍网络风暴发生、分析和处理的过程,最后确定风暴源头是主变小室A网交换机。为减少网
络风暴的发生,提出了网络风暴的
准
建议,并给出了“分
隔离+ping
+重启”的网络风暴快速定位、快速隔
控系统的安全稳定运行。快速处理的,可尽快恢复网
;网
;
,确保了变电
关键词:网 风暴;交
;分级隔离;快速定位DOI
:
10.3969/j.
iss.
1000
-
3886.2020.06.015[中图分类号&
TM63
[文献标志码]A
[文章编号&
1000
-3886(2020)06
-0045
-03Analysis
and
TreatmenO
ot
Network
Storm
Fault
Cases
at
SubstationsL-
Shiqun,Song
Wci,Wang
Chong,Guo
Fci,Kang
Ying(State
Grii
Jibci
Electric
Porr
Co.
2o0,Maintenance
Branch,Beijing
S02488,China
#Abstract:
Substation
netaork
storm
wcs
studied
in
this paper.
Firstly,
the
mechanism of
netaork
storm ct
substations
wcs
analyzed.
Then,
ccose
of
substation
netaork
storm
wcs
discussed.
Based
on
the
topoloaicoi
analysis
of
substation
netaork,
the
processes
of occurrence,
analysis
and
processing
were
introduced
step by
step.
Finally,
-t
wcs
determined
thct
the
storm
wcs
attributable
to
the
A
一
netaork
switch
in
the
main
transformer
room. In
order
to
reduce
the
occurrence of netaork
storm,
proposals
were
made
reaarding
theprevention
of
netaork
storm.
Furthermore,
the
-
hierarchicci
isolation
+
ping
+
restart"
approach
wcs
presented
for
quick
location,
isolation
and
processing
of
netaork
storm.
Thus,
the
netaork
could
be
recovered
to
its
normci state
cs
soon
cs
possible
so
cs
to ensure
safe,
stable
operation
of
the
monitoring
system
of
the
dt:netaork
storm;
swhch;
netaork
topology;
prevention;
hierarchicci
isolation;
rapid
positioning0引言随着综合自动化系统的不断发展和应用,网络设备作为系统
的信息交
只
响
台变得越来越重要。单
或
的间隔的数据传输,但网
设
出现异常,连接响变电站的安全可的所有
会丧失功能,直
主机1
交换机1
交换机2
主机1运行。在各类网络异常中,网络风暴可以说对变电站运行影响最
大。网风暴发生时,大量
图1多交换机设备间网络环路交换机作为数据链路层设备,基于MAC地址表实现报文的
塞网络,使正常的遥测、遥信和查找和转发,当网
环路时,转
出的报文还会通过其他路
:
收,如此
复循环,使网络中的
越来越多,
网
风暴。控
传输,甚
网络瘫痪,此时监控
掌握变电站情况,
进行相应的遥控操作,对变电站安全稳定运行构(2)
网卡损坏。
风暴。网中的某台或多台主机设备网卡
了
的[1_2]o损坏,就
向网络中不停
量
,通过转发后造成网络
1
络风暴产生机理由于网络拓扑、网络设备或其他原因导致报文短时间内在网
(3)
网络参数设置不当。对交换机端口带宽和速率限制不当,
量
络中大量复制,阻塞
数据传输,使
在网络上的设备网络
要转发时,交
来不及处理也会造成网络臃性能下降甚至网络瘫痪的
就是网络风暴。网
风暴产生的
因
要有:塞。
设
网卡双工模式设置不合理时,会产生一些FCS校验错误帧
量碰撞帧,
网络风暴⑷。(1)网
环路。 网络设
环和设备间环路2种。设备(4) 网络病毒。如Funlove、震荡波和RPC等病毒,感染主机
后会立即通过网络进行传播,占据大量网络带宽,引起网络堵塞,
自环为一根网线的两端分
间环路为
交
同一个交
的2
构成的环路[3],
,设1之间相
造成网络风暴⑸!2
定稿日期:2020
-03
-27络风暴故障案例变电站对自动化网络通信的实时性和可靠性有很高要求,通Electrical
Automation
452.1网络拓扑分析《电气自动化》2020年第42卷第6期电力系统及其自动化____________________________________Powee
System
&
Automaticn常的网络拓扑结构有星型和环形两种%6「7&
o冀北地区500
kV变
第二步,断开远动装置、监控主机等主机设备的A、B网,网
电站站控层网络均为A、B双网星型结构,由中心交换机和各小室交换机组成,如图2所示。—°
公共设备阿
.告警直传1告警直传2络未恢复。第三步,依次断开各小室至A网中心交换机级联的光电转
,断
变小室后,除主变小室测控
他
信恢
复,数据
fJJJ新。复正常,恢复网线后,再次重启A网中心交
换机第四步,检查主变小室A网交换机无自环现象后,断开交换
远动2机所有网线,小室内测控
测控
,仍
启动。B网中心交
换机光电转换
装置公用测
控光电转换
装置保护管理机光电转换
装置第五步,用Ethereal抓包工具抓取A、B网交换机的通信报
文,
A网通信报文有重复, 的每帧
有相同的光缆光缆光缆[光电转换•
装置
I两份,如图4、图5分别截取了的17、18号两帧报文内容相同。测控装it
測控装st
.500
kV保护»测控装置测控装置220
kV保护室测控装置
测控装置.
主变保护莎图2变电站双星型网络拓扑各小室测控装置连接A、B网交换机,再通过光缆与中心交
换机相连,将数据上
下的
控后台和远动
的环节。设备。星型网络信速度比较快、
延时比较固定,但光电转[置的应用,
加了网
2.2
象某日调度主站发现某500
kV变电站全站除500
kV金太双
回)220
kV太院双回外,其余遥测数据均不刷新,同时站内监控
后台情况相同,且
状态
3
o图4
A网交换机17号重复报文©
烟舷
Ethbzl
一 .*1解二「回因卜|朗曰◎刁“
|幻|胃殳眉2、26
0.04
567029
0.04W8JO
0.049SJQ
n
0.0S4W34
0.054370321
21322327
0.974伙浦B2U.8.d.d236.8.8.8256.3.5.8
2泌上.8.8236.8.8.8296.8.8.8
2
泌.8.8.8
2U.s.a.d回
Prane
18
C74
bytw
on
wire.
74 bytes
captured)□
£th«rn«
II.
Sr<:
8S:«8:cO:48:Ca:ll
(83:88:c0:48:Ca:ll).
Oil:
01:00:5«:0«:08:
intcrntT
Protocol,
Sr<5
(19?.168.1.17)
,
O$T:
8.8
Q泌.8.8.(3
us电r
Ddtaqram
Protxcl
・
Port:丄889
(1889)・
Ds*
Port:丄888
l
丄E图3监控后台通信状态图从通信状态图可以看出,除了
500
kV金太双回测控、220
kV
太院双回测控、220
kV母联分段测控和4
变高压侧测控显示
A网中断、B网
以外,其他间隔测控均显示A、B网通信中断。0030信异常的测控
,
测控装置面板显示“请等3S
Mm待…”,按
反应,
进 显示界面。图
5%A
交
18
复报3
3.1
的处理和分析处理第一步,重启问题测控,装置无法启动,液晶界面显示“请等
ab网后再重启,测控
因此可以确定是由主变小室A网交换机产生的网络风暴。第六步,
常,
变
室A网交
并恢复网线,
运行正待…”。断
未恢复。、启动,但网分析显
第
重复报文。,恢复主变小室至A网中心交换机的连接,全站网络46
Eeciioca"Auiomaioon____________________________________电力系统及其自动化Power
System
&
Automation《电气自动化》2020年第42卷第6期恢复正常,数据刷新正常。网络设备尤其是交换机,由于运行环境的影响,可靠性会逐
渐降低。交
3.2
原因分析根据
处理过程,可以确定是主变小室A网交换机故障
电源的电解电容使用寿
工作的环境温度有关,环境温度每增加10
q,使用寿命会
对网络设备进行改造更换。倍,因此应及时产生了网络风暴,并过中心交
传
变电
他保
室,导致上送。分间隔测控的通信中断,数据
电源回路中滤波电容C47、C13、C8
4)
参数开启交换机生成树协议(spanning
tree
protocol,STP)功能,可
随后对故障交换机进行检测,查找网络风暴的原因,发现交裂,
6避免因环路产生的网络风暴。进行合理的VLAN划分,可以限制
广播域,
降低网络风暴的影响。5)
动态监视利用网
分析仪监测网络中报文流量是否出现异常,利用网
络安
测
对网络病毒
起的网络风暴进行及时发4.2
,从而在风暴产生的初期进行处理,防止
络风暴的处理围的
。由于网络风暴发生后严重影响变电站的监视、控制和安全稳
定运行,因此如果能尽快判断出网络风暴并采
间内恢复网络运行变得尤为重要。变电
在最短的时生网络风暴时,一般表现为:①不同保护小室的多个间隔层设备与监控后台、调
信中断;②测、遥信可屏
上送;③些间隔层设
死机状态,且重启
图6交换机主板电源回路图显示,进入未
。复;④断开网
的设
复
;⑤同时
运行环
恶劣,交
运行时间
三个失效电容为同一参数6.3
V/1
500
-F-
105
q,且为并
出现如上所述
能。此时检
行
时,应考虑变电站出现网络风暴的可联关系,其中
电容损坏后,会加速
电容的损坏速度!,使交
交
片运以采用“分
隔离+
pine
+重启”的
进电容损坏会导致电源VCC输出波动
环路,这时
(,最
的定位
,以
2
网
的变电
生网
风行异常。当交换机交换芯片
器异常变位时,会导致内部形成
的报文在自环
之间反复环回转发,最终会转
他
环
(
风暴,这些风暴
联控层A网交
的所有
上。软硬件性能不同的测控
实,双网中断的测控
风暴的性能不一样,经过核网口带宽为10
M,当网络风暴流量,且
理板对网络风暴抑制机制不
时,会
塞
网口,并使管理板CPU负荷持续增高,进
响到CPU的处理
终导致A、B网中断。,最而A网中断、B网正常和遥测数据正常刷新的装置,经过核
实均为近
建,网口带宽为100
M,且
理板有一定的网络风暴抑制
,因此A网通信中断后不影响CPU的处理,B
网依
信
。4网络风暴的预防和处理4.1网络风暴的预防通过对网络风暴产生机理和案例的分析可以在如下几个方
面采
,
网风暴的发生:1)
设
型质量稳定、符合入网检测标准以及合格的网络设备和主
机设备,特是本身具有网络风暴抑制功能的设备。2)
设
内
网图7网络风暴定位处理流程图型网络结构组网,不采用可能造成网络风暴的环按照该流程图进行一步步隔离和排查,有条件的可在排查期
间通过ping命令
头,并尽快恢复
网结构,同时对网
构进行合理
、合理
,严
产生自环
和设备间环网现象。断,可以迅速定位网络风暴的网
信。(下转第54页%Eeciioca"Auiomaioon
473)
设
造《电气自动化》2020年第42卷第6期电力系统及其自动化____________________________________Power
System
&
Automation指标变化量标幺值与Uzf关系如图4(
a)所示。控制器系数>
取值区间长度对系统可靠性影响。逐步缩小>
间,计
调整定电压控制Uzf将影响系统电压分布,影响系统潮流进
而影响可靠性。由图4(a)可知,该系统Uzf在i
~
1.01倍U间
时系统有较高
性,升高或降低Uzf都会造成系统
间下系统可靠性指标。
变化量标幺值与>区间
系
4(
b)所示。调整控制系数>将影响负荷在各电源节点间的分配比例,
性下降。在Uzf高于1.
01U?时系统
性显著下降。影响系统潮流进而影响
性。
4(b)知,该系统>
取值4.3
Droop控制特性4“取值范围对可靠性影响将 >
在0.8~1.2间
得
性
间
于0.16时,系统
性逐渐降低。此,
间
作为基准值,研究为0.
12时,系统LOLP、LOLF达到最大值,继续缩小取值范围
LOLP、LOLF保持不变。这是因为
>
区间长度为0.
12时,所有系
统状态均出现负荷削减。5结采用二阶截断状态枚举法进行状态抽样,用计及换流站控制
策略的交直流混合电网的负荷削减模型进行状态分析,通过测试
例验证了所提
参考文献:的有效性
行性。:i
&严胜,罗湘,贺之渊.直流电网核心装备及关键技术展望[J].电力
系统自动化,2019,43(3)
:
289
-300.:2
&
丽,
丽,庞辉,等•模块化多电平换流器的结构可靠性分
tU示幺值(a)
Uz标幺值与可靠性关系:3
&
析[J].中国电机工程学报,2016,36(7):
152
-
158.,
,
君,等.计
控制方式的直流电网潮流计算方法[J].电网技术,2016,40(3)
:
712-718.:4
&
先,温
,潘,等.采用改进粒子群算法的直流电网最优
赳潮流控制[J].电网技术,2017,61(3)
$39
-44.040040(上接第47页)5
结本文针对变电站网络风暴开展研究,分析了变电站网络风暴
产生的机理。针对一起变电站网络风暴案例进行分析,以变电站
网络拓扑分析为基础,逐步介绍网络风暴发生、分析和处理的过
程,确定风暴源头是主变小室A网交换机。然后为减少网络风暴
的发生,提出了网络风暴的预防建议,并给出了“分隔离+pdg
+重启”的网络风暴快速定位、快速隔
案例
的安全稳定运行。参:[1
]高吉普,徐长宝,戴宇,等•智能变电站IEEE
1588以太网交换机
故障案例复现测试及分析[J].电力系统保护与控制,2014,
42
(14)
:
146
-
150.[2
:周,吴海,何昭辉,等.合并单元装置级联网络风暴的防治[J].南方电网技术,2016,
10(6)
:
44
-48.54
Electrical
Automationy晅*m:5
&
,
,
,.含柔性直流电网的交直流混联系统潮流优化控制[J].电力系统自动化,2017,
41
(12)
:
70
-76.超晅轻:6
&谢绍宇,
:7
&
丽,
凡•交直流混联系统
性评估[J].电力自动化设备,2011,31
(7)
:
10-16..电力系统风险评估模型方法和应用[M].北京:科学出版,
2006.[8
] CIGRE.
The
cigro
b4
-
de
grid
test
system
[J].
CIGRE
technical0
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40忍取值区间长度brochure,2013,27
:
10 -
19.(b)九标幺值与可靠性关系图4控制参数与系统可靠性关系【作者简介】任柳清(1995―),女,云南人,研究生,主要研究方向:直流电
网可靠性评估。[3
:
晓.以太网交换机环路产生的原因及分析方法[J].电力信息
与通信技术,2016,
14(2)
:
157
-160.[4
]
瑞江,梁晓兵,高新华,等.变电站自动化系统网络故障分析
[J].广东电力,2008
,
21
(1)
:
42
-46.[5
]
[6
]
,
,
,
,
•.
变电站网络风暴的监测和过滤算法研究[J].电力系统保护与控制,2013,
41
(18)
:
68
-72.,光明,等..
,.
变电站过程层网络风暴的分析与变电站继电保
网络压力产处理[J].中国电力,2014,
47
(11)
:
112
-115.[7
]余越,周
霞,
(18):
156
-162.快速处理的标准
,生原因及测试方法研究[J].电力系统保护与控制,2017
,
45
明了该处理
的高
有序,确保了变电 控系统【作者简介】李世群(1989―),男,河北衡水人,硕士生,工程师,主要从事
变电站自动化系统和二次安防等方面的工作。宋巍(1971—),男,河北
张家口人,高级工程师,主要从事电网二次系统管理工作。
王W
(1982—),男,北京人,高级工程师,主要从事电网二次系统管理工作。郭飞(1983―),男,河北石家庄人,高级工程师,主要从事变电站自动化管
理工作。
康莹(1989—),女,北京人,工程师,主要从事电网二次系统检
修工作。


发布评论