2023年11月28日发(作者:)

CommVault故障排除⼿册第⼀版

CommVault技术⽩⽪书

CommVault故障排错指南

版本控制:

⽬录

第⼀篇:⽂档介绍. (3)

第⼆篇:⽇志分析篇 (4)

1:安装⽇志 (4)

2:作业⽇志 (6)

3:管理⽇志 (7)

4:⽇志结构: (7)

第三篇:故障排错篇 (9)

1:C OMM S EVE故障排错 (9)

2:MA服务故障排错 (11)

3:L IBRARY故障排错 (13)

4:通讯故障排错 (13)

5:⽂件备份故障排错 (13)

6:⽂件恢复故障排错 (15)

6:O RACLE备份故障排错 (15)

7:O RACLE恢复故障排错.................................................................................... 错误!未定义书签。

8:DB2备份故障排错 ....................................................................................... 错误!未定义书签。

9:DB2恢复故障排错 ....................................................................................... 错误!未定义书签。

10:I NFORMIX备份故障排错 .............................................................................. 错误!未定义书签。

10:I NFORMIX恢复故障排错 .............................................................................. 错误!未定义书签。

11:AD备份故障排错 ....................................................................................... 错误!未定义书签。

12:AD恢复故障排错 ....................................................................................... 错误!未定义书签。第⼀篇:⽂档介绍.

备份系统因为涉及到操作系统平台,数据库应⽤,带库设备. 如果遇到错误我们应该以什么样的思路去发现问题并快速寻求答

.

3): ⼯具使⽤篇

第⼆篇:⽇志分析篇

系统都有那么⽇志?我该去哪⾥找到需要的⽇志?我该如何去查看⽇志?

这些问题都是我们在故障排除阶段⾸先需要明确的问题. 只有知先发现问题,才能寻找的解决问题的⽅案.

本章节将介绍CommVault 在安装,运维过程中如何利⽤⽇志进⾏故障排错.

1:安装⽇志

CommVault 安装过程中如何遇到问题,我该去哪⾥看⽇志呢?

SQL Server2005

CommServe安装⾸先涉及到SQL Server2005 的安装,如果SQL Serverd的安装失败,那CommVault模块的安装也将⽆法继续.

SQL 安装的记录⽇志:

C:Program FilesMicrosoft SQL Server90Setup BootstrapLOG

如果SQL 安装失败,请到以上⽬录找“”查看具体是那个模块失败.然后再去下⼀层⽬录 Files下找到该模块对应的

详细⽇志分析.

如何查看SQL Server 2005 安装⽇志⽂件

Microsoft SQL Server 安装的主⽇志位于

%ProgramFiles%Microsoft SQL Server90Setup

如果Summary⽇志⽂件显⽰某个模块失败,可以通过查看此模块⽇志(搜索“return value 3”)调查失败的根源。产品⽇志可

位于:

%ProgramFiles%Microsoft SQL Server90Setup BootstrapLOGFiles

该⽇志的命名约定如下:

SQLSetup[XXXX][s]_[COMPUTERNAME]_[PRODUCTNAME]_[Y].log,其中

XXXXX = 该安装的枚举数(最后执⾏的安装具有最⼤的枚举数)

COMPUTERNAME= 正在运⾏安装程序的计算机

PRODUCTNAME= 产品名称(.msi ⽂件的名称),例如:Reporting Services

SQLSetup0001_MachineName_Notification Services

SQLSetup0001_MachineName_

Y= 如果在⼀次安装运⾏中多次安装了 Microsoft Windows Installer ⽂件(.msi),则将该数字添加到⽇志名称上并递增。?

主要发⽣在 Microsoft XML Core Services (MSXML) 上。

下表包含安装每⼀个 SQL Server 组件的⽰例⽇志⽂件名称和⽇志⽂件说明。

Windows2003平台

Commvault安装⽇志在windows2003 保存在以下⽬录:

C:Documents and SettingsAll UsersApplication DataCommvault SystemsGalaxy 注意:Application Data是系统隐藏⽬

录。

查看⽇志:

Windows2008 :

Commvault安装⽇志在windows2008保存在以下⽬录:

C:ProgramDataCommVault SystemsGalaxyLogFiles

注意:ProgramData是系统隐藏⽬录。

Unix & Linux

Commvault安装⽇志在Unix 平台保存在以下⽬录:

/tmp/.gxsetup

注意:.gxsetup是隐藏⽬录.

.[xxxxx]

2:作业⽇志

作业⽇志是指CommVault产品已经成功安装,在作业运⾏阶段的⽇志信息。Windows:

Windows的作业⽇志⽬录可以从以下注册表中得到:

HKEY_LOCAL_MACHINESOFTWARECommVault SystemsGalaxyInstance001EventManager dEVLOGDIR:

E:CommVaultSimpanaLog Files

Unix & Linux

Unix的运⾏⽇志⽬录可以从以下命令得到:

# simpana status|grep -i log

Log Directory = /var/log/simpana/Log_Files

3:管理⽇志

管理⽇志是指CommVault 产品的⼀些配置信息⽇志,该类型⽇志主要记整个CommCell域内部的相关操作,包括如下:

License ⽇志、 Patch 更新、数据时效、防⽕墙、DR备份等信息

管理⽇志于作业⽇志存放在同⼀⽬录下:

Windows:

Windows的管理⽇志⽬录可以从以下注册表中得到:

HKEY_LOCAL_MACHINESOFTWARECommVault SystemsGalaxyInstance001EventManager dEVLOGDIR:

E:CommVaultSimpanaLog Files

Unix & Linux

Unix的管理⽇志⽬录可以从以下命令得到:

# simpana status|grep -i log

Log Directory = /var/log/simpana/Log_Files

4:⽇志结构:

从上⾯章节我们⼤体可以将CommVault的⽇志分为如下4 ⼤类:

1.安装⽇志: 所有产品模块安装相关⽇志。

2. 管理⽇志:数据时效,DR备份,License审核, 防⽕墙配置等相关⽇志.

3.服务⽇志: Windows上的服务,Unix 上的 Daemon 等显⽰服务对应的,如下进程:(Cvd,EvmgrC,CvMountd,CvRepSvc…

etc

4. 作业⽇志: 指作业运⾏才会被启动的进程对应⽇志. 如下进程:

(FileScan, ClOraAgent, Dsbackup ..etc)

服务⽇志和作业⽇志每个进程会对应⼀个独⽴的⽇志,这样的⽇志结构能够便于快速查

找和定位错误信息.

注意:

1: 作业进程是动态的,只有在作业发起后才会被启动.所以作业⽇志也只有作业运⾏状态下才更新类似的作业进程如下:

iFind,SrvDb2Agent,ClDb2Agent, SrvOraAgent, ClOraAgent

2: 管理⽇志并没有显式的对应进程,⽽是由CVD中的多线程来控制,例如:

DataAgent. License_Db .

本节将介绍CommVault的主要服务进程与⽇志的对应关系:

CommServe

CommServe上有那些进程,这些对应哪些⽇志,如果遇到问题我该去查看哪个⽇志? 下⾯的表格描述了CommSereve上的主

要进程和对应⽇志信息。

MediaAgent:

下⾯的表格描述了MediaAgent上的主要进程和对应⽇志信息。

Client:

下⾯的表格描述了Client上的主要进程和对应⽇志信息

第三篇:故障排错篇

在第⼆篇中我们介绍了CommVault中的⽇志类型,和⽇志结构,本章将详细介绍不同情形下的错误该如何去查找⽇志,

1:CommSeve故障排错

CommServe 上的故障通常表现为1: 服务⽆法启动; 2:服务正常,CommCell⽆法登陆.

CommServe 服务异常

可能原因:

SQL数据库物理或逻辑故障.

查看⽇志:SQL ⽇志. System Event Log

解决⽅案:

A: 如果是数据⽂件逻辑损坏,可尝试⽤DBCC DBMaintenance ⼯具修复

DBCC:进⼊SQL EM. 执⾏以下语法

DBMaintenance: 可在SIMPAN Base ⽬录下找到

B: 如果逻辑修复失败,就要进⾏物理恢复:

使⽤DR Dump 进⾏物理恢复.

ODBC连接失败

查看⽇志: ; ; CVCsl_Licensing_ ;

CommCell GUI 与数据库通过本地ODBC通讯,其默认绑定⽤户为”sqladmin_cv”,该⽤户是在安装过程中默认创建. 该账户默认

同步数据库中的⽤户密码和注册表中的pACCESS 键值:

HKEY_LOCAL_MACHINESOFTWARECommVault SystemsGalaxyInstance001Database

如果在SQL Server⼈为删除或修改了账户密码,注册表没有同步,那么ODBC连接将失败. 解决⽅案:

A: 到数据库装将密码还原为原始密码。

B:“CreateCSSQlAccont”⼯具同步数据库与注册表:(该⼯具可在RP 中找到)

IP地址变更 / Hosts 表变更

如果有IP地址变更, Hosts File CommSeve注册主机名对应了不⼀致的IP地址.也会导致服务异常.

解决⽅案:

1):CVCsl_Licensing_确认查找现在的当前使⽤IP 与注册IP 的冲突信息。然后修改为正确IP 地址.

2):如果是使⽤DNS 进⾏名称解析。确认DNS 双向解析正确.

3):如果是使⽤HOSTS来进⾏名称解析。确认HOSTS表中的对应关系是否正确.

CommCell

1: 是否启⽤SSO ,域服务器同步异常。域⽤户账户密码过期,域⽤户被锁。权限组被更改.

2:MA故障排错

MA脱机

可能原因:通信异常,服务端⼝被占⽤,防⽕墙限制.

查看⽇志: , ,

检查以上⽇志,查看是否有端⼝错误,

1904716 607 05/15 18:44:20 ### SERVICE [ ] Succesfully updated IndexCacheInfo in the registry for host [cv_BI2DW1].

1904716 1 05/15 18:44:20 ### SERVICE [ ] ::1441: Going to Release Receiver Semaphore in

CVMA_RESYNC_REQ

1904716 1 05/15 18:44:25 ### CVMAService::getMLMMsgInstance() - :***** NO CONNECTION TO MEDIAMANAGER

SERVICE, START A NEW ONE *****

1904716 1 05/15 18:44:25 ### Connect to 192.168.0.47:2698 failed: Connection refused

1904716 1 05/15 18:44:25 ### CVMAService::getMLMMsgInstance() - ::1287:***** MEDIAMANAGER

SERVICE IS DOWN *****

1904716 304 05/15 18:44:25 ### THREADS [ ] CVMAServantThread thread starts: ThreadId = 772

解决⽅案:

确认本地端⼝服务是否正常,是否有被占⽤或冲突.不同平台确认⽅式如下:

Windows:

CMD>netstat -ano |find "port"

Linux:

# netstat -anp |grep "port"

#lsof

AIX:

#netstat -Aan|grep 1334

HP & Solaris:

#lsof (该⼯具可从⽹上下载获取)

B: 确认MACS 的通讯正常.

Cvping [hostname]

Telenet [hostname] [Port]

2: CV_Mount 错误:

CV Mount 磁带分为三个步骤:

1: CvMount进程控制Library Move磁带.

2: 驱动器Load 磁带.

3: OML 验证

如果MA⽆法Mount 介质,我们需要从以上三个⽅⾯去查看⽇志.

A:Move 介质: 查看Library[xx]_C[xx].log.

B:Load 介质: 查看

C: OML 验证: 查看

D: 是否有系统服务控制产⽣冲突(Windows SRM, HP EMS, HP Manager Agent )

E: 是否有第三⽅带库控制软件同时在控制带库.

3: Data Writer (Data Mover)错误:

如果介质已经正常Mount,却⽆法写⼊需要从以下⽅⾯去查看⽇志

A (Cvd是控制DataMove 的主进程.同时协调CVMA. DmWrite, DsBackup ) B: 介质加载的BlockSize 是否

有匹配错误

C: DsBackup & DmWrite. 查看是否写⼊错误.

D: 是否有系统服务控制产⽣冲突.

例如:(Windows SRM, HP EMS, HP Manager Agent )

E:是否有第三⽅带库控制软件同时在控制带库.

3:Library故障排错

带库异常因为涉及硬件因素,所以会有太多的因素影响,对于带库异常我们应该采取:排除定位法确认问题的根源是:硬

件,链路,系统,还是CV 本⾝.

影响因素:

操作系统版本,链路连接。

Libbrary 型号,驱动版本,驱动器型号,驱动,Firmware

HBA 卡型号,驱动,Firmware.

4:通讯故障排错

5: ⽂件备份故障排错

⽂件备份分为如下步骤:通信握⼿,扫描,介质加载,数据传输,备份索引.

CommCell GUI 上你看到的不同的阶段的错误就要去查看不同的错误

1:作业0% ⽴即失败:

此阶段是CommServeClient 建⽴通信连接失败,确认客户端服务是否正常.CommSeve检查⽇志: ,

,

Client 检查⽇志: ,

2: 作业5% 停留或失败:

此时说明CommServeClient进程通信已经正常建⽴,只是客户端Ifind 进程在⽂件扫描;或Client MA ⽆法通信,MA

CreateIndex 失败, 检查以下⽇志

Client 检查⽇志:

MediaAgent 检查⽇志:

3: 作业25% 停留或失败:

此时⽂件扫描已经完成,MA Mount介质或或建⽴DataPipe 时遇到异常

CommServe检查⽇志:

MediaAgent检查⽇志: , , , (Windows) Client 检查⽇志:,

,

4: 作业90% 停留或失败:

⽂件备份停留在90%,表明数据备份已经完成,MA在备份索引阶段遇到异常; 此时遇到错误可以清楚了解错误和客户端已经没

有关系,问题出在CommServeMA之间CommServe检查⽇志:

MediaAgent检查⽇志: ,

6: ⽂件恢复故障排错

1:⽆法浏览⽂件列表:

如果从CommCell ⽆法浏览⽂件列表,检查⽇志: CommServe检查⽇志: , MediaAgent检查⽇志: ,

检查项⽬:

A:是否CommServe 时间被调前.

B: MA ⽆法访问, IndexCache 是否可访问.

2: ⽆法加载磁带.

检查⽇志:

CommServe检查⽇志: , MediaAgent检查⽇志: ,

6: Oracle备份故障排错

1:作业5% ⽴即失败:

此阶段说明数据库连接错误,应该检查⽹络原因:CommServe检查⽇志: Client 检查⽇志:

2:作业10% ⽴即失败:

已经建⽴连接,⽣成脚本或于MA 通信失败

CommServe 检查⽇志:

Client 检查⽇志: , MediaAgent检查⽇志: