2023年11月28日发(作者:)
CommVault故障排除⼿册第⼀版
CommVault技术⽩⽪书
CommVault故障排错指南
版本控制:
⽬录
第⼀篇:⽂档介绍. (3)
第⼆篇:⽇志分析篇 (4)
1:安装⽇志 (4)
2:作业⽇志 (6)
3:管理⽇志 (7)
4:⽇志结构: (7)
第三篇:故障排错篇 (9)
1:C OMM S EVE故障排错 (9)
2:MA服务故障排错 (11)
3:L IBRARY故障排错 (13)
4:通讯故障排错 (13)
5:⽂件备份故障排错 (13)
6:⽂件恢复故障排错 (15)
6:O RACLE备份故障排错 (15)
7:O RACLE恢复故障排错.................................................................................... 错误!未定义书签。
8:DB2备份故障排错 ....................................................................................... 错误!未定义书签。
9:DB2恢复故障排错 ....................................................................................... 错误!未定义书签。
10:I NFORMIX备份故障排错 .............................................................................. 错误!未定义书签。
10:I NFORMIX恢复故障排错 .............................................................................. 错误!未定义书签。
11:AD备份故障排错 ....................................................................................... 错误!未定义书签。
12:AD恢复故障排错 ....................................................................................... 错误!未定义书签。第⼀篇:⽂档介绍.
备份系统因为涉及到操作系统平台,数据库应⽤,带库设备. 如果遇到错误我们应该以什么样的思路去发现问题并快速寻求答
案.
3): ⼯具使⽤篇
第⼆篇:⽇志分析篇
系统都有那么⽇志?我该去哪⾥找到需要的⽇志?我该如何去查看⽇志?
这些问题都是我们在故障排除阶段⾸先需要明确的问题. 只有知先发现问题,才能寻找的解决问题的⽅案.
本章节将介绍CommVault 在安装,运维过程中如何利⽤⽇志进⾏故障排错.
1:安装⽇志
在CommVault 安装过程中如何遇到问题,我该去哪⾥看⽇志呢?
SQL Server2005:
CommServe安装⾸先涉及到SQL Server2005 的安装,如果SQL Serverd的安装失败,那CommVault模块的安装也将⽆法继续.
SQL 安装的记录⽇志:
C:Program FilesMicrosoft SQL Server90Setup BootstrapLOG
如果SQL 安装失败,请到以上⽬录找“”查看具体是那个模块失败.然后再去下⼀层⽬录 Files下找到该模块对应的
详细⽇志分析.
如何查看SQL Server 2005 安装⽇志⽂件
Microsoft SQL Server 安装的主⽇志位于
%ProgramFiles%Microsoft SQL Server90Setup
如果Summary⽇志⽂件显⽰某个“模块”失败,可以通过查看此模块⽇志(搜索“return value 3”)调查失败的根源。产品⽇志可
位于:
%ProgramFiles%Microsoft SQL Server90Setup BootstrapLOGFiles
该⽇志的命名约定如下:
SQLSetup[XXXX][s]_[COMPUTERNAME]_[PRODUCTNAME]_[Y].log,其中
XXXXX = 该安装的枚举数(最后执⾏的安装具有最⼤的枚举数)
COMPUTERNAME= 正在运⾏安装程序的计算机
PRODUCTNAME= 产品名称(.msi ⽂件的名称),例如:Reporting Services 的
SQLSetup0001_MachineName_、Notification Services 的
SQLSetup0001_MachineName_
Y= 如果在⼀次安装运⾏中多次安装了 Microsoft Windows Installer ⽂件(.msi),则将该数字添加到⽇志名称上并递增。?这
主要发⽣在 Microsoft XML Core Services (MSXML) 上。
下表包含安装每⼀个 SQL Server 组件的⽰例⽇志⽂件名称和⽇志⽂件说明。
Windows2003平台
Commvault安装⽇志在windows2003 保存在以下⽬录:
C:Documents and SettingsAll UsersApplication DataCommvault SystemsGalaxy 注意:Application Data是系统隐藏⽬
录。
查看⽇志:
Windows2008 :
Commvault安装⽇志在windows2008保存在以下⽬录:
C:ProgramDataCommVault SystemsGalaxyLogFiles
注意:ProgramData是系统隐藏⽬录。
Unix & Linux
Commvault安装⽇志在Unix 平台保存在以下⽬录:
/tmp/.gxsetup
注意:.gxsetup是隐藏⽬录.
.[xxxxx]
2:作业⽇志
作业⽇志是指CommVault产品已经成功安装,在作业运⾏阶段的⽇志信息。Windows:
Windows的作业⽇志⽬录可以从以下注册表中得到:
HKEY_LOCAL_MACHINESOFTWARECommVault SystemsGalaxyInstance001EventManager dEVLOGDIR:
【E:CommVaultSimpanaLog Files】
Unix & Linux
Unix的运⾏⽇志⽬录可以从以下命令得到:
# simpana status|grep -i log
Log Directory = /var/log/simpana/Log_Files
3:管理⽇志
管理⽇志是指CommVault 产品的⼀些配置信息⽇志,该类型⽇志主要记整个CommCell域内部的相关操作,包括如下:
License ⽇志、 Patch 更新、数据时效、防⽕墙、DR备份等信息
管理⽇志于作业⽇志存放在同⼀⽬录下:
Windows:
Windows的管理⽇志⽬录可以从以下注册表中得到:
HKEY_LOCAL_MACHINESOFTWARECommVault SystemsGalaxyInstance001EventManager dEVLOGDIR:
【E:CommVaultSimpanaLog Files】
Unix & Linux
Unix的管理⽇志⽬录可以从以下命令得到:
# simpana status|grep -i log
Log Directory = /var/log/simpana/Log_Files
4:⽇志结构:
从上⾯章节我们⼤体可以将CommVault的⽇志分为如下4 ⼤类:
1.安装⽇志: 所有产品模块安装相关⽇志。
2. 管理⽇志:数据时效,DR备份,License审核, 防⽕墙配置等相关⽇志.
3.服务⽇志: Windows上的服务,Unix 上的 Daemon 等显⽰服务对应的,如下进程:(Cvd,EvmgrC,CvMountd,CvRepSvc…
etc )
4. 作业⽇志: 指作业运⾏才会被启动的进程对应⽇志. 如下进程:
(FileScan, ClOraAgent, Dsbackup ..etc)
服务⽇志和作业⽇志每个进程会对应⼀个独⽴的⽇志,这样的⽇志结构能够便于快速查
找和定位错误信息.
注意:
1: 作业进程是动态的,只有在作业发起后才会被启动.所以作业⽇志也只有作业运⾏状态下才更新类似的作业进程如下:
iFind,SrvDb2Agent,ClDb2Agent, SrvOraAgent, ClOraAgent
2: 管理⽇志并没有显式的对应进程,⽽是由CVD中的多线程来控制,例如:
DataAgent. License_Db .
本节将介绍CommVault的主要服务进程与⽇志的对应关系:
CommServe:
CommServe上有那些进程,这些对应哪些⽇志,如果遇到问题我该去查看哪个⽇志? 下⾯的表格描述了CommSereve上的主
要进程和对应⽇志信息。
MediaAgent:
下⾯的表格描述了MediaAgent上的主要进程和对应⽇志信息。
Client:
下⾯的表格描述了Client上的主要进程和对应⽇志信息
第三篇:故障排错篇
在第⼆篇中我们介绍了CommVault中的⽇志类型,和⽇志结构,本章将详细介绍不同情形下的错误该如何去查找⽇志,
1:CommSeve故障排错
CommServe 上的故障通常表现为1: 服务⽆法启动; 2:服务正常,CommCell⽆法登陆.
CommServe 服务异常
可能原因:
SQL数据库物理或逻辑故障.
查看⽇志:SQL ⽇志. System Event Log
解决⽅案:
A: 如果是数据⽂件逻辑损坏,可尝试⽤DBCC 或DBMaintenance ⼯具修复
DBCC:进⼊SQL EM. 执⾏以下语法
DBMaintenance: 可在SIMPAN Base ⽬录下找到
B: 如果逻辑修复失败,就要进⾏物理恢复:
使⽤DR Dump 进⾏物理恢复.
ODBC连接失败
查看⽇志: ; ; CVCsl_Licensing_ ;
CommCell GUI 与数据库通过本地ODBC通讯,其默认绑定⽤户为”sqladmin_cv”,该⽤户是在安装过程中默认创建. 该账户默认
同步数据库中的⽤户密码和注册表中的pACCESS 键值:
HKEY_LOCAL_MACHINESOFTWARECommVault SystemsGalaxyInstance001Database
如果在SQL Server⼈为删除或修改了账户密码,注册表没有同步,那么ODBC连接将失败. 解决⽅案:
A: 到数据库装将密码还原为原始密码。
B:⽤“CreateCSSQlAccont”⼯具同步数据库与注册表:(该⼯具可在RP 中找到)
IP地址变更 / Hosts 表变更
如果有IP地址变更, 或Hosts File 中CommSeve注册主机名对应了不⼀致的IP地址.也会导致服务异常.
解决⽅案:
1):从CVCsl_Licensing_确认查找现在的当前使⽤IP 与注册IP 的冲突信息。然后修改为正确IP 地址.
2):如果是使⽤DNS 进⾏名称解析。确认DNS 双向解析正确.
3):如果是使⽤HOSTS来进⾏名称解析。确认HOSTS表中的对应关系是否正确.
CommCell
1: 是否启⽤SSO ,域服务器同步异常。域⽤户账户密码过期,域⽤户被锁。权限组被更改.
2:MA故障排错
MA脱机
可能原因:通信异常,服务端⼝被占⽤,防⽕墙限制.
查看⽇志: , ,
检查以上⽇志,查看是否有端⼝错误,
1904716 607 05/15 18:44:20 ### SERVICE [ ] Succesfully updated IndexCacheInfo in the registry for host [cv_BI2DW1].
1904716 1 05/15 18:44:20 ### SERVICE [ ] ::1441: Going to Release Receiver Semaphore in
CVMA_RESYNC_REQ
1904716 1 05/15 18:44:25 ### CVMAService::getMLMMsgInstance() - :***** NO CONNECTION TO MEDIAMANAGER
SERVICE, START A NEW ONE *****
1904716 1 05/15 18:44:25 ### Connect to 192.168.0.47:2698 failed: Connection refused
1904716 1 05/15 18:44:25 ### CVMAService::getMLMMsgInstance() - ::1287:***** MEDIAMANAGER
SERVICE IS DOWN *****
1904716 304 05/15 18:44:25 ### THREADS [ ] CVMAServantThread thread starts: ThreadId = 772
解决⽅案:
确认本地端⼝服务是否正常,是否有被占⽤或冲突.不同平台确认⽅式如下:
Windows:
CMD>netstat -ano |find "port"
Linux:
# netstat -anp |grep "port"
#lsof
AIX:
#netstat -Aan|grep 1334
HP & Solaris:
#lsof (该⼯具可从⽹上下载获取)
B: 确认MA于CS 的通讯正常.
Cvping [hostname]
Telenet [hostname] [Port]
2: CV_Mount 错误:
CV Mount 磁带分为三个步骤:
1: CvMount进程控制Library Move磁带.
2: 驱动器Load 磁带.
3: OML 验证
如果MA⽆法Mount 介质,我们需要从以上三个⽅⾯去查看⽇志.
A:Move 介质: 查看Library[xx]_C[xx].log.
B:Load 介质: 查看
C: OML 验证: 查看
D: 是否有系统服务控制产⽣冲突(Windows SRM, HP EMS, HP Manager Agent )
E: 是否有第三⽅带库控制软件同时在控制带库.
3: Data Writer (Data Mover)错误:
如果介质已经正常Mount,却⽆法写⼊需要从以下⽅⾯去查看⽇志
A: (Cvd是控制DataMove 的主进程.同时协调CVMA. DmWrite, DsBackup ) B: 介质加载的BlockSize 是否
有匹配错误
C: DsBackup & DmWrite. 查看是否写⼊错误.
D: 是否有系统服务控制产⽣冲突.
例如:(Windows SRM, HP EMS, HP Manager Agent )
E:是否有第三⽅带库控制软件同时在控制带库.
3:Library故障排错
带库异常因为涉及硬件因素,所以会有太多的因素影响,对于带库异常我们应该采取:”排除定位法”确认问题的根源是:硬
件,链路,系统,还是CV 本⾝.
影响因素:
操作系统版本,链路连接。
Libbrary 型号,驱动版本,驱动器型号,驱动,Firmware
HBA 卡型号,驱动,Firmware.
4:通讯故障排错
5: ⽂件备份故障排错
⽂件备份分为如下步骤:通信握⼿,扫描,介质加载,数据传输,备份索引.
在CommCell GUI 上你看到的不同的阶段的错误就要去查看不同的错误
1:作业0% ⽴即失败:
此阶段是CommServe与Client 建⽴通信连接失败,确认客户端服务是否正常.:CommSeve检查⽇志: ,
,,
Client 检查⽇志: ,
2: 作业5% 停留或失败:
此时说明CommServe与Client进程通信已经正常建⽴,只是客户端Ifind 进程在⽂件扫描;或Client 于MA ⽆法通信,MA上
CreateIndex 失败, 检查以下⽇志
Client 检查⽇志:
MediaAgent 检查⽇志:
3: 作业25% 停留或失败:
此时⽂件扫描已经完成,MA Mount介质或或建⽴DataPipe 时遇到异常
CommServe检查⽇志:
MediaAgent检查⽇志: , , , (Windows) Client 检查⽇志:,
,
4: 作业90% 停留或失败:
⽂件备份停留在90%,表明数据备份已经完成,MA在备份索引阶段遇到异常; 此时遇到错误可以清楚了解错误和客户端已经没
有关系,问题出在CommServe和MA之间CommServe检查⽇志:
MediaAgent检查⽇志: ,
6: ⽂件恢复故障排错
1:⽆法浏览⽂件列表:
如果从CommCell ⽆法浏览⽂件列表,检查⽇志: CommServe检查⽇志: , MediaAgent检查⽇志: ,
检查项⽬:
A:是否CommServe 时间被调前.
B: MA ⽆法访问, IndexCache 是否可访问.
2: ⽆法加载磁带.
检查⽇志:
CommServe检查⽇志: , MediaAgent检查⽇志: ,
6: Oracle备份故障排错
1:作业5% ⽴即失败:
此阶段说明数据库连接错误,应该检查⽹络原因:CommServe检查⽇志: Client 检查⽇志:
2:作业10% ⽴即失败:
已经建⽴连接,⽣成脚本或于MA 通信失败
CommServe 检查⽇志:
Client 检查⽇志: , MediaAgent检查⽇志:
发布评论