2023年12月23日发(作者:)
VMAX10K容灾SRDF管理手册
易安信电脑系统(中国)有限公司
2014年09月23日
文档版本号:
生成日期:
审核日期:
1.0
文档信息
项目名称:
文档作者:
文档审核者:
文档维护记录
版本号
1.0
维护日期
2014年9月23日
作者/维护人
张亮
描述
创建
版权说明
本文件中出现的任何文字叙述、文档格式、插图、照片、方法、过程等内容,除另有特别注明,版权均属外汇管理局公司和EMC公司所有,受到有关产权及版权法保护。任何个人、机构未经外汇管理局公司和EMC公司的书面授权许可,不得复制、引用或传播本文件的任何片断,无论通过电子形式或非电子形式。
第 1 页
目 录
第一章
EMC SRDF技术介绍 ........................................................................................................ 4
1.1
SRDF/S ........................................................................................................................................ 4
1.2
SRDF/A ........................................................................................................................................ 4
第二章
2.1
2.2
环境描述 ......................................................................................................................... 6
整体架构 ............................................................................................................................... 6
存储信息 ............................................................................................................................... 7
2.3
DG信息与RDFG信息 .................................................................................................................. 7
2.3.1
2.3.2
2.3.3
第三章
dg介绍 ............................................................................................................................. 7
rdfg介绍 ........................................................................................................................... 7
dg与rdfg 列表 ................................................................................................................ 8
SRDF操作 ........................................................................................................................ 9
3.1
LUN状态对应表 ........................................................................................................................ 9
3.2
SRDF状态查询 .......................................................................................................................... 9
3.2.1
3.2.2
查询同城SRDF/S状态 ..................................................................................................... 9
查询异地SRDF/A状态 .................................................................................................... 9
3.3
SRDF分离与恢复流程............................................................................................................. 10
3.3.1
3.3.2
3.3.3
3.3.4
3.3.5
3.3.6
3.4
3.4.1
3.4.2
3.5
3.5.1
停止SRDF/A一致性保护命令....................................................................................... 12
分离命令 ........................................................................................................................ 12
更改为自适应拷贝模式命令 ........................................................................................ 12
恢复增量拷贝命令 ........................................................................................................ 13
更改为SRDF/A或SRDF/S模式命令 ............................................................................. 13
启用SRDF/A一致性保护命令....................................................................................... 13
分离与恢复操作示例脚本 ................................................................................................. 13
货物贸易同城SRDF/S分离与恢复 ............................................................................... 14
货物贸易异地SRDF/A分离与恢复 ............................................................................... 14
现有业务扩盘加入容灾 ..................................................................................................... 14
扩容盘加入容灾流程 .................................................................................................... 14
第 2 页
3.5.2
扩容盘加入容灾示例脚本 ............................................................................................ 15
3.5.2.1 创建临时pair ............................................................................................................................. 15
3.5.2.2 临时pair完成同步 .................................................................................................................... 16
3.5.2.3 SRDF/S move pair ......................................................................................................................... 16
3.5.2.4 SRDF/A move pair ......................................................................................................................... 16
3.5.2.5 将扩容盘加入dg ........................................................................................................................ 17
3.5.2.6 检查 ............................................................................................................................................ 17
第四章
故障与维护 ................................................................................................................... 18
4.1
SRDF链路中断 ........................................................................................................................ 18
4.2
4.3
生产中心灾难切换 ............................................................................................................. 18
生产中心恢复回切 ............................................................................................................. 18
第 3 页
第一章 EMC SRDF技术介绍
SRDF(Symmetrix Remote Data Facility)运用EMC Symmetrix数据存储系统实现灾难恢复和业务连续性。
SRDF提供了从一个到一个、一个到多个物理上分离的Symmetrix系统的数据复制技术,尤其在多点容灾技术方面, SRDF远程数据复制技术在中间站点容量需求、扩展性等方面有一定优势。
在外汇管理局的环境中,涉及SRDF技术的三个主要的类型:
1.1 SRDF/S
同步方式的SRDF,是将本地生产数据以完全同步的方式复制到异地,每一个本地的I/O 处理均需等待远程复制的完成,从而实现主/备中心磁盘阵列同步地进行数据更新。
1.2 SRDF/A
异步方式的SRDF,是将本地生产数据以后台处理的方式复制到异地的方式,每一个本地的I/O 处理后,无需等待远程复制的完成就正常释放,也就是在应用系统的I/O写入主磁盘阵列后,主磁盘阵列立即返回给主机应用系统“写完成”信息,主机应用可以继续进行读、写I/O的操作。
第 4 页
第 5 页
第二章 环境描述
2.1 整体架构
外汇管理局目前的EMC存储系统,由3台EMC Symmetrix高端存储组成。构成“并发型SRDF”容灾结构,即concurrent SRDF.
后续文档中,采用“型号-序列号末3位”的方式标示存储。
北京机房为生产中心,有1台VMAX10K-213和1台DMX3-223;
上海机房为异地灾备中心,有一台VMAX10K-214。
北京机房的VMAX10K-213和DMX3-223之间采用EMC SRDF/S技术实现背靠背同城数据保护;
北京机房的VMAX10K-213和上海机房的VMAX10K-214之间采用EMC SRDF/A技术实现异地数据保护;
逻辑拓扑如下:
第 6 页
2.2 存储信息
存储名称
存储序列号
SRDF属性
控制主机
以上设备在使用中有任何问题,请联系EMC24小时支持热线:
固话拨打:800-819-0009
手机拨打:400-670-0009
请提供故障设备的序列号,并记录case号码。
DMX3-223
CK290300223
R2
北京
VMAX10K_213
CN498700213
R1
100.1.193.98
上海
VMAX10K_214
CN498700214
R2
100.8.192.96
2.3 dg信息与rdfg信息
2.3.1 dg介绍
SRDF技术基于LUN级别进行复制,同一个业务的LUN可建立Device
Group,即dg,通过该业务的SRDF group (rdfg)形成配对关系,进行统一管理操作。
dg信息保存在管理机上,如果主机重装操作系统,需要先将dg信息导出备份,之后重新安装SE软件并且导入dg信息。
2.3.2 rdfg介绍
SRDF/A要求每一个业务建立独自的rdfg,相当于复制的逻辑通道。
对于每一个业务来说,从生产存储出发,都有2个rdfg,一个去往同城容灾的DMX3-223,另一个去往异地容灾的VMAX10K-214.
在指定dg进行SRDF操作时,要通过指定rdfg来确定操作的是同城容灾还第 7 页
symrdf –g DG_NAME –rdfg 同城rdfg split
(断开同城容灾)
symrdf –g DG_NAME –rdfg 异地rdfg split
(断开异地容灾)
是异地容灾。例如,断开SRDF:
2.3.3 dg与rdfg 列表
可以用如下命令查看某一台管理机上的dg:
/usr/symcli/bin/symdg list
同城系统名称
货物贸易
资本项目
ASONE
国际收支
国际收支
表单系统(银行网和内网)
表单(分局报表)
货物贸易(海关前置)
政府网站
stage group
异地rdfg
10
13
16
19
22
25
28
31
34
2
11
14
17
20
23
26
29
32
35
8
DG
29_tradedb_dg
32_cfadb_dg
46_asonedb_dg
47_bizdb_dg
48_bopdb_dg
21_interdb_dg
20_bdfjbbdb_dg
28_chkinportdb_dg
35_zfwzdb_dg
LUN数量
74
45
5
11
16
9
9
7
14
rdfg
第 8 页
第三章 SRDF操作
下面的所有操作,以”货物贸易”即29_tradedb_dg来做示例。
3.1 LUN状态对应表
SRDF pair状态 R1 lun状态
Split
Suspend
Synchronized
Consistent
syncInProg
partition
failedover
RW
RW
RW
RW
RW
RW
WD
R2 lun状态
RW
RW
WD
WD
WD
RW
RW
RW - 磁盘处于read/write状态,主机可以使用
WD - 磁盘处于write disable状态,主机不可使用
注意:
在使用SRDF操作使LUN变成WD之前,需要先停止业务,umount文件系统,并varyoff vg。
3.2 SRDF状态查询
3.2.1 查询同城SRDF/S状态
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 10 query
3.2.2 查询异地SRDF/A状态
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 11 query -rdfa
在正常保护状态下,查看点:
a. RDF pair state
同城SRDF/S (北京VMAX10K-北京DMX3)应为synctronized
异地SRDF/A(北京VMAX10K-上海VMAX10K)应为consistent
第 9 页
b. Invalid track
应为0.
输出结果示例:
3.3 SRDF分离与恢复流程
在保护状态下,R1的LUN为RW状态,主机可使用;R2的LUN为WD状态,主机不可使用。
经过SRDF的分离操作,R2的LUN状态变为RW状态,主机可以进行读写操作。
SRDF中最常用的就是分离和恢复操作,其流程步骤如下:
同城SRDF/S的分离与恢复流程
第 10 页
分离操作只需要split一条命令即成功。
在需要恢复时,如果分离时间较长,数据差异大,建议先修改成自适应拷贝模式,此时只更改状态,未发起同步。
恢复增量同步后,数据开始增量拷贝,待接近追平时,重新修改为同步状态。
异地SRDF/A的分离与恢复流程
分离操作只需要disable(停止一致性保护)和split两条命令即。
在需要恢复时,如果分离时间较长,数据差异大,建议先修改成自适应拷贝模式,此时只更改状态,未发起同步。
恢复增量同步后,数据开始增量拷贝,待接近追平时,重新修改为异步状态。
最后启用一致性保护。
第 11 页
具体步骤命令如下:
3.3.1 停止SRDF/A一致性保护命令
(仅适用异地SRDF/A操作,同城SRDF/S不需操作此步骤)
/usr/symcli/bin/symrdf –g DG_NAME disable
示例:
3.3.2 分离命令
/usr/symcli/bin/symrdf –g DG_NAME split
示例:
3.3.3 更改为自适应拷贝模式命令
(如果分离时间较长,可更改为自适应拷贝模式,这种模式数据拷贝速度较快,且不对R1的读写时间造成影响)
/usr/symcli/bin/symrdf –g DG_NAME set mode acp_disk
第 12 页
3.3.4 恢复增量拷贝命令
/usr/symcli/bin/symrdf –g DG_NAME establish
3.3.5 更改为SRDF/A或SRDF/S模式命令
/usr/symcli/bin/symrdf –g DG_NAME set mode async
/usr/symcli/bin/symrdf –g DG_NAME set mode sync
3.3.6 启用SRDF/A一致性保护命令
(仅适用异地SRDF/A操作,同城SRDF/S不需操作此步骤)
/usr/symcli/bin/symrdf –g DG_NAME enable
3.4 分离与恢复操作示例脚本
第 13 页
3.4.1 货物贸易同城SRDF/S分离与恢复
分离操作
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 10 split
恢复操-1 修改自适应拷贝模式
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 10 set mode acp_disk
恢复操-2 恢复增量拷贝
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 10 est
恢复操-3 修改同步模式
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 10 set mode sync
3.4.2 货物贸易异地SRDF/A分离与恢复
分离操作-1 停止一致性保护
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 11 disable
分离操作-2 分离
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 11 split
恢复操-1 修改自适应拷贝模式
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 11 set mode acp_disk
恢复操-2 恢复增量拷贝
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 11 est
恢复操-3 修改同步模式
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 11 set mode async
恢复操-4 启用一致性保护
/usr/symcli/bin/symrdf –g
29_tradedb_dg –rdfg 11 enable
3.5 现有业务扩盘加入容灾
3.5.1 扩容盘加入容灾流程
第 14 页
现有业务如果扩盘,需要加入容灾,在完成两端主机认盘后,首先要在stage
rdfg中创建扩容盘的临时SRDF pair,完成北京到上海的数据拷贝(由于生产存储上所有盘都已经预先做了SRDF到DMX3,所以不需要重新做生产VMAX到DMX3的临时pair同步);
然后把同城和异地的SRDF pair分别从stage rdfg移动到表格的规划rdfg中,movepair的操作需要在split状态下完成;
最后将生产的扩容盘加入dg,实现统一检查和管理。
流程图如下:
3.5.2 扩容盘加入容灾示例脚本
模拟场景:”货物贸易”扩容2个LUN,示例列表如下:
生产LUN ID
AA1
AA2
对于生产扩容的LUN,对应的异地LUN ID与生产的一样;对应的同城LUN ID可以查询之前总结的盘号excel文件。
3.5.2.1 创建临时pair
同城LUN ID
BB1
BB2
异地LUN ID
CC1
CC2
第 15 页
在控制路径下vi两个pair文件:
s_用于SRDF/S的操作,其中第一列是生产LUN,第二列是同城LUN;
aaa_用于SRDF/A的操作,其中第一列是生产LUN,第二列是异地LUN。
vi s_
AA1 BB1
AA2 BB2
vi aaa_
AA1 CC1
AA2 CC2
3.5.2.2 临时pair完成同步
在本步骤中,先要将异地R2的目标LUN置成write disable,然后用上一步的pair文件建立起同步对,并发起数据拷贝直到拷贝完成。
symdev –sid 214 write_disable CC1
symdev –sid 214 write_disable CC2
/usr/symcli/bin/symrdf createpair -sid 213 -file aaa_ -rdfg 8 -type rdf1
-invalidate r2 -rdf_mode acp_disk
(此命令为2行)
/usr/symcli/bin/symrdf -sid 213 -file aaa_ -rdfg 8 est
/usr/symcli/bin/symrdf -sid 213 -file aaa_ -rdfg 8 set mode async
3.5.2.3 SRDF/S move pair
此操作需要在把扩容lun和原有lun的pair都置成split
/usr/symcli/bin/symrdf -sid 213 -file s_ -rdfg 2 split
/usr/symcli/bin/symrdf -g 29_tradedb_dg -rdfg 10 split
/usr/symcli/bin/symrdf -sid 213 -file s_ -rdfg 2 movepair -new_rdfg 10
3.5.2.4 SRDF/A move pair
/usr/symcli/bin/symrdf -sid 213 -file aaa_ -rdfg 8 split
/usr/symcli/bin/symrdf -g 29_tradedb_dg -rdfg 11 split
第 16 页
/usr/symcli/bin/symrdf -sid 213 -file s_ -rdfg 8 movepair -new_rdfg 11
3.5.2.5 将扩容盘加入dg
由于在movepair的操作需要在split状态下做,在movepair做完且加入dg后,可以使用dg一起将扩容后的合集拉起同步
symdg –g 29_tradedb_dg –sid 213 add dev AA1
symdg –g 29_tradedb_dg –sid 213 add dev AA2
symrdf –g 29_tradedb_dg –rdfg 10 est
symrdf –g 29_tradedb_dg –rdfg 11 est
3.5.2.6 检查
symrdf –g 29_tradedb_dg –rdfg 10 que
symrdf –g 29_tradedb_dg –rdfg 11 que -rdfa
第 17 页
第四章 故障与维护
4.1 SRDF链路中断
SRDF状态可能由于链路故障,SRDF pair states变为suspend或partition。
在排查链路故障后,进行相应的手工恢复,步骤如下:
设置自适应拷贝模式
该模式可提高数据复制速度,且不对生产读写产生压力。
/usr/symcli/bin/symrdf –g DG_NAME set mode acp_disk
恢复数据同步
/usr/symcli/bin/symrdf –g DG_NAME establish
设置同步或异步模式
/usr/symcli/bin/symrdf –g DG_NAME set mode sync/async
4.2 生产中心灾难切换
由于SRDF切换动作会改变lun读写权限,所以计划内演练需按照如下步骤进行:
生产业务停止
生产数据库停止
生产端主机卸载文件系统
生产端主机去激活vg
SRDF failover操作
/usr/symcli/bin/symrdf –g DG_NAME –rdfg 同城rdfg failover
容灾端主机激活vg
容灾端主机挂载文件系统
容灾端主机启动数据库
容灾端主机恢复业务运行
4.3 生产中心恢复回切
第 18 页
容灾端主机业务停止
容灾端主机数据库停止
容灾端主机卸载文件系统
容灾端主机去激活vg
SRDF failback操作
/usr/symcli/bin/symrdf –g DG_NAME –rdfg 同城rdfg failback
生产端主机激活vg
生产端主机挂载文件系统
生产端主机启动数据库
生产端主机恢复业务运行
待生产端故障恢复,下达回切指令后,应按照如下步骤进行回切:
第 19 页


发布评论