2024年3月10日发(作者:)

材料科学论坛页码,1/18

可打印版本的主题

原始主题

( /?

f=23&t=16746 )

材料科学论坛

> Materials Studio > MS

常见的几种出错信息(原创整理)

发帖人

: sdzzz

发帖时间

: 2006-10-30 15:41

MS

常见的几种出错信息(原创整理)

对于初学者而已,面上的常见的出错信息有以下几种:

1

、安装问题

主要是

LICENSE

2

GATEWAY

主要是没有在客户端设置服务器的地址

3

、网络问题

4

、计算时问题

系统资源不够,多是内存不够,或者由于系统分析时间过长而出现的超时问题

5

、收敛问题

很常见,原因很多,特别是对于大系统

6

、其他具体问题

发帖人

: sdzzz

发帖时间

: 2006-10-30 16:13

1

、安装问题--出错信息就不提供了

1

Windows

系统

1

)主要是

LICENSE

问题,特别是在

Windows

系统中安装--只要把

LICENSE

,一般名为“

”拷贝到

C:Program FilesAccelrysLicensePackLicenses

即可

2

)注意

MS

运行时需要一定的硬盘空间来放置临时数据,所以,千万注意你

的磁盘情况;

3

)还有,对应于内存的虚拟内存

4

)服务器如果链接不上,请检查网卡是否正常;网卡正常,那请查看防火

墙设置是否正确

-----------------------

2

UNIX/LINUX

1

LICENSE

对于

UNIX

license

文件应该放在

license pack/licenses

下面,文件名应改为

file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6

材料科学论坛页码,2/18

2

)没有

root

帐号,不能

mountiso

文件

可以刻录到光盘上安装

3

)安装用户

不要用超户安装,要有普通用户

4

shell

每次进入

bash

时显示

The shell bash is not supported

计算的时候,也出现这个提示,

/home/msi/MaterialStudio/CASTEP/bin/castepexe_: error while

loading shared libraries: libmkl_: cannot open shared object file:

No such file or directory

然后退出

--》

ms_ -s bash

改为

sh

就可以了

5

)选择是否启动

Gateway

服务,一般选是

6

)没有制定临时文件夹

如果用的是

csh,

在安装用户根目录下修改

.cshrc(bash

用户修改

.bashrc),

内容如

:

eval `/home/msi/MaterialsStudio/Licensing/Setup/lic_ -s csh`

eval `/home/msi/MaterialsStudio/share/bin/ms_ -s csh`

setenv TMPDIR /home/msi/tmp

setenv

DMOL3_DATA /home/msi/MaterialsStudio/Data/Resources/Quantum/DMol3

setenv DMOL_TMP /home/msi/tmp

setenv MESODYN_HOME /home/msi/tmp

setenv PATH ${PATH}:/home/msi/MaterialsStudio/DMol3/bin

并在安装用户根目录下建一个

tmp

临时文件夹

------------------------

3)LINUX

集群

问题比较多

1

Error: Package Archive '/' does not exist

--》可以找其他正常安装的拷贝一个

2

)没有

root

帐号,不能

mountiso

文件

可以刻录到光盘上安装

3

)不能并行,只能单机版

cluster

还得明确指定

installtype,

加个参数

-t cluster

4

Gateway start failed - process 6194 is not running.

file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6

材料科学论坛页码,3/18

装的时候不要用

root

帐户,用自己的帐户,并且装在自己的主目录里,再启动

就不会有问题了。

5

)不能多节点多

CPU

并行

windows

下提交任务的时候总是不能选多机并行。在

Run in parallel on

选项那

里一直只能显示

1

--》

主要是没有指定节点,而且没有为各节点制定

CPU

数量。

要修改两个文件里面的

cpu

数目,具体路径在

../Gateway/root_default/dsd/conf

里把

cuptotal

改成

cluster

的数目。

--》

copy to /etc/

或者自己新建一个

内容如下:

localhost

omain

compute-0-0

compute-0-1

compute-0-2

.

.

.

compute-0-6

compute-0-7

.

.

.

在安装用户根目录下建一个

.rhosts

文件

,

内容跟

一样

---》

修改

MaterialsStudio/MPICH/share/

文件,把要用的计算节点

写上去,格式如下:

compute-0-0:2

compute-0-1:2

compute-0-2:2

.

.

.

compute-0-6:2

compute-0-7:2

.

.

.

冒号后为每个节点的

cpu

--》

修改

MaterialsStudio/Gateway/root_default/dsd/conf

下两个文件

file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6

材料科学论坛页码,4/18

中的

total cpu

否则在客户机上的

job_control

中只能看到安装节点上的

cpu

6

)没有

mpi

临时文件夹

rsh localhost

Trying

krb_sendauth failed: You have no tickets cached

trying normal rlogin (/usr/bin/rlogin)

Last login: Thu May 5 17:02:10 on :0

--》

mpi

没有写文件的地方

发帖人

: sdzzz

发帖时间

: 2006-10-30 16:20

2

GATEWAY

问题

这个好像不应该单列,但是既然单列了,就写点东西吧!

1

Windows

系统

1

)单机版

如果不准备提供其他计算机访问,可以不安装

GATEWAY

2

)服务器--本机

如果安装了服务器,并安装了

GATEWAY

,那么,在

MS

客户端的

GUI

程序里

面已经设置了

GATEWAY

,可以看见

LOCALHOST

项;

如果提交任务的时候失败,一般是网卡不正常,或者防火墙问题;

3

)提交到其他

Windows

服务器中

如果失败,可以先检查下超时时间的设置;

然后检查网络可达性;

如果对端计算机没有问题,那么,只能考虑网络上是否有防病毒措施把端口封

住了;

还可以核实下端口是否是

18888

--可以用浏览器查看下:

d:18888/

看看返回什么

2

LINUX

1

)安装时要安装

GATEWAY

2

)在启动中启动

其他类似上面

------------------

请高手指正补充!

发帖人

: sdzzz

发帖时间

: 2006-10-30 16:26

3

、网络问题

file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6

材料科学论坛页码,5/18

牵涉到网络问题的主要有以下几个方面:

1

)网络可达性

主要有:

*

网络的链接状态

*

网络拥塞状况

*

病毒,比如最近的

arp

病毒

*

如果服务器和客户端在一个网段,还有地址盗用问题

*

防火墙:本机,对端,交换机,路由器,网络防火墙

*

流量控制

以上很多都和学校的网络策略有关

2

)服务器

/

客户端的访问

*

用户控制

*

进程管理

*

队列

*

超时的设置

3

)并行主机之间

由于并行主机之间要交换数据,如果网络传输出现错误或故障也会导致失败

请补充!

发帖人

: sdzzz

发帖时间

: 2006-10-30 16:41

4

、计算时问题

1

Communication-failure

在使用

CASTEP

计算一个作业时,出现如下错误提示:

Error while monitoring job RT390: Failure in gateway communication while getting

job message.

Job Status: Communication-failure

尽管出现以上错误提示,但是此时计算机的内存及

cpu

使用仍然很高

cpu100

%),好像作业仍在计算。关掉那个错误提示小窗口,

Job control

口中显示作业仍然处于

Communication-failure

状态。

--

>

计算大系统时,经常会出现这样的问题,多与超时,或系统繁忙有关。

a)

增加

GATEWAY

的连接时间;

b)

计算时,需要保存中间数据,默认的保存间隔对于小系统不存在问题,计算

大系统时,应该延长这个时间,比如

CASTEP

默认的是每分钟保存一次,可延

长到

2

小时或更多;

c)

一个不经意的问题是磁盘空间,大系统的计算时,会产生很大的数据文件,

尤其是在几何优化和分子动力学的计算中,磁盘空间的耗尽也会导致这样的问

题;

d)

与上一个问题相关的,系统内存的耗尽。一般地,物理内存之外,系统有虚

拟内存,如果这两者之和仍然不够使用,就会出现这样的问题;可通过

windows

的任务管理器监测,如果不够,调大虚拟内存或增加物理内存;

e) Castep & Dmol

计算的时候,自动产生存档文件和相关的目录,

Materials

file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6

材料科学论坛页码,6/18

Studio

有两个限制:一是不能使用中文目录和文件名;二是目录和文件名层层

嵌套后的总长度

<255

个字符,比如

D:MaterialsStudio2006

MS_work_dirAl6O9 FilesDocumentsAl2O3 DMol3 GeomOptAl2O3 DMol3

GeomOptAl2O3_,

这个限制来源于早期的

DOS

版本对文件路径总长度的

限制

(FFH)

,长了以后也会有这样的问题;

f

)单机运行

MaterialsStudio

应该不存在网络通讯和并行错误的问题;一般的,

不要使用

License

服务器的

License

2

Error allocating real_bands_qp in nlxc

主要可能是内存不够

3

Error in allocating wvfn%coeffs in wave_allocate_wv

多可能是由于系统较大,导致内存等资源不能满足要求;

可以尝试增加缓存,或在

job control

里的

optimization

memory

;但这不是根

本;

增加内存试试,如果不行,只能考虑更换平台,或者降低精度和系统复杂度

了。

4

)停电

这个问题比较复杂,我把自己最近查到的列下:

.........................................................

使用

CASTEP

做并行结构优化,就快结束优化的时候停电了。

这样的情况下,还是能够继续在前面已经优化的基础上继续优化。方法有如

下几种:

a

)把

OUT

文件中有关优化出来的结构信息拷贝出来,替换原来输入文件中描

述的结构的部分

(一般的作法)。大部分的程序都是每优化一步,都会写出相应这一步优化

得到的结构。

b

)如果保存着计算中的

.check

文件,仍可以继续优化。

但是只有在

standalone

的模式下计算才能得到停电这种情况下的

.check

文件,

通过

gateway

的话必须在点击

download result

以前就去临时文件夹下面

copy

。如

果你将断电前的最后得到的结构继续优化的话,得到的结果将和你原来计算的

结果有差异。这是因为如果你是按断电前的结果优化,就等于是一个新的结构

优化计算,这个计算的结果可能会和不断电的情况下得到的结果有差异。但是

未必这样的结果就不准确,能不能用要靠你对计算的结果进行分析了,这个要

看具体的情况,

.check

文件在的话只是说你可以按照断电前的情况继续算下

去,就是说应该是和没断电的结果是一样的。

.castep

.geom

两个文件中都有结构坐标,但是这两个文件中的坐标不一

样,不知道该用哪一个文件中的坐标。

还有,是不是用上述文件中的结构坐标代替所有

.cel

文件中的坐标,然后就可

以继续进行结构优化。

file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6

材料科学论坛页码,7/18

5

)其他计算时的出错

一般来说,小系统出现计算溢出或其他错误的可能要小些,对于具体的出错,

可以先看看是不是和系统资源有关系。

发帖人

: sdzzz

发帖时间

: 2006-10-30 17:02

5

、收敛问题

很常见,原因很多,特别是对于大系统

一般来说,小系统出现计算溢出或其他错误的可能要小些,对于具体的出错,

可以先看看是不是和系统资源有关系。

1

SCF

最大仍不收敛

一般来说,

MS

默认的

SCF

次数

100

对于小系统是够用的,但是,原子数一多,

就不一定了。

a)

首先结构的合理性,如果自建的结构偏离最低能量太大(或失配度太大),

可能会难以收敛

b)

取消一切对称性,充分驰豫晶格

c)

有些结构本身就是亚稳态,

scf

的各项收敛指标如果设的太高,对于亚稳态就

可能达不到如此的精度。

d)

改变收敛的条件,降低精度

(

能量的截断值

)

e)

增加循环次数

f)

改变赝势

2

)对于绝缘体,可以设置能带占据情况的

OPTION BOX

3

)磁性材料的自旋设置;

4

supercell

可以增加长度尺寸

5

)过渡元素,重元素等

f

层电子问题;

相对论修正问题。

6

)未找到基态能

在计算过程中经常遇到计算失败的情况,文件给出的警告是:

*Warning* max. SCF cycles performed but system has not reached the groundstate.

Warning: electronic minimisation did not converge when finding ground state.

-->

参照上面

和收敛有关的参数主要有能量的

CUTOFF

SCF

的次数,

SMEAR

,以及

K

点选

取等,可以尝试一下。

7

)优化不收敛

增加设

tions

的大小

interations

是定义积分精度的,相当于

gaussian

里的

int

选项;根据

gauss

的经验,

file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6

材料科学论坛页码,8/18

对重原子如果不用细的积分网格,结果就不准确,特别是频率计算,可能会把

正的频率算成负的频率。提高

interations

的确可以提高精度,特别是对于过渡

态和频率计算。

3

)优化后计算性能参数,还要再优化

目前据我的理解是,可能是计算几何优化的时候选取的一些参数和计算性能,

比如能量时的不同。

目前我还不清楚,请各位达人给出解答。

6

)总能和文献不一致,而且多种方法都不同

很正常,只要相对值近似就可以

在倒空间进行电子结构计算的方法中

,

都存在一个能量零点的取法的问题

,

不同

的程序

,

取的不同

.

根本原因是

V(G)

G=0

是发散的

(

可以去

R.T. Martin

的电子结

构那本书

).

castep

是利用周期性

,

在倒空间进行电子结构计算的

.

我没有记错的话

,Dmol3

是在

实空间来进行电子结构计算的

.

能量零点的取法就跟不同前者了。

因此在进行电子结构计算中,不要比较任何绝对能量值的大小,这样是毫无意

义的,即使是同一个程序中也是这样,更不用说是两个不同的程序。

能量的相对值才具有物理意义。

发帖人

: sdzzz

发帖时间

: 2006-10-30 17:11

6

、其他问题

有很多了。

比如:

*

优化时同时选择计算能量,与优化后再计算能量,为什么得到的结果不同;

*

ULTRAFINE

进行优化,计算能量,同时选择计算光学性质,为什么和试验

数据差别这么大

*

赝势的选择问题

*

如何计算特定温度下的材料性能参数

*... ...

大家可以举出很多问题,希望能够加强交流,共同进步!

发帖人

: sdzzz

发帖时间

: 2006-10-30 20:09

由于本人接触

MS

的时间比较短,很多东西还懵懵懂懂的,不甚了了,所以,

还请各位学兄学弟学姐学妹前辈高人们多多指教。如果大家有什么问题或者什

么经验,千万放上来,共同进步岂不是更好!

发帖人

: cbFeng200881

发帖时间

: 2006-10-31 17:09

谢啦 哥们

本人体会:

MS

貌似简单,实则难亦!

发帖人

: progressing988

发帖时间

: 2006-10-31 17:22

file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6

材料科学论坛页码,9/18

sdzzz

,你真好,!一定支持你。

发帖人

: sdzzz

发帖时间

: 2006-10-31 20:09

引用

:(cbFeng200881 @ 2006-10-31 17:09)

谢啦

哥们

本人体会:

MS

貌似简单,实则难亦!

是啊,和理论功底不够扎实也有关系!

想想自己过去学得还是不好

... ...

发帖人

: sdzzz

发帖时间

: 2006-10-31 20:43

希望各位同学积极跟贴。

将自己的经验和遇到的相关问题贴出来,大家一起分享。

发帖人

: sdzzz

发帖时间

: 2006-11-05 16:50

VAMP

常见错误及原因

--------------------------

by Sunkiller

--------------------------

1 VAMP

任务运行失败(

If a VAMP job fails

MS

会在任务运行前检查绝大多数数据及参数设置,如果设置不合要求,

MS

会提示出错及出错原因,用户可以根据提示在

VAMP Calculation

对话框

中修改参数设置。

但是有些任务在运行前检查无错,在运行过程仍会出错。这种情况下,出

错信息会在中显示或只在输出文件中显示。服务器任务目录中保存的文件也

会对分析出错原因有所帮助,可是使用服务器控制

Server Console (Tools

|Server Console)

来查看这些文件。

以下内容为常见出错原因,可以帮助用户纠正常见错误。

提示:可以使用

View | Project Log

来及时查看错误信息或警告信息。

1.1

不能运行任务:

Run

按钮灰色不可用(

Cannot start a VAMP job: Run

button is grayed out.

1

. 当前文件不是

3D

结构文件。如果当前文件不是

3D

结构文件如图表文

件或文本文件,则

Run

按钮呈现灰色不可用,此时可以激活

3D

结构文

件使之为当前文件,则

Run

按钮可用;

2

. 当前文件为周期性结构。

VAMP

只能对单个分子进行操作。

1.2

不能运行任务:网关与网络问题(

Gateway and network communication

problems

VAMP

任务不能运行的大多数问题都源于此。

1

. 客户端的网关没有注册:在客户端安装的

MS

不设置远程服务器地址,

用户可以用

Server Console

检查网关注册情况,也可以用它添加网关;

2

. 可用服务器的客户端网关没有注册:

VAMP

需要服务器程序才能运行

file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6

材料科学论坛页码,10/18

任务,且只有服务器网关被选中才能运行,用户可以用

Server Console

查看可用服务器的网关设置;

3

. 本地网关过期:网关信息保存在相应的网关中,它包含可用服务器的

基本信息。当通过

Server Console

PC

机上注册一个新的网关时,服

务器列表被拷贝到客户端

PC

机上。但当添加一个新的服务器或从网关

删除一个服务器时,

PC

机上的网关信息仍保存,所以必须更新才可使

用,可以通过

Server Console

更新;

Sunkiller

编辑整理,更多内容请来材料科学论坛

Sunkiller

编辑整理,更多内容请来材料科学论坛

4

. 网关不可用:如果计算机的网关关闭或网关程序出错,则任务不能运

行,用户可以选择不同的网关进行运算,通过

Server Console

进行设置;

5

. 网络问题:

MS

需要与网关进行交流,如果网络出现问题,则任务不能

进行。用户可以用

Server Console

检查网关是否开通及是否运行,如果

用同一网关在不同的

PC

机上能进行任务,则说明是

PC

机的问题;

6

. 分离服务器管理程序(

Disconnected Server Manager program

DSMgr

问题:

MS

与网关的交流通过分离服务器管理程序完成,此程序为后台

运行且不能直接查看,但以下特征可能说明该程序处问题: