2024年3月10日发(作者:)
材料科学论坛页码,1/18
可打印版本的主题
原始主题
( /?
f=23&t=16746 )
材料科学论坛
> Materials Studio > MS
常见的几种出错信息(原创整理)
发帖人
: sdzzz
发帖时间
: 2006-10-30 15:41
MS
常见的几种出错信息(原创整理)
对于初学者而已,面上的常见的出错信息有以下几种:
1
、安装问题
主要是
LICENSE
2
、
GATEWAY
主要是没有在客户端设置服务器的地址
3
、网络问题
4
、计算时问题
系统资源不够,多是内存不够,或者由于系统分析时间过长而出现的超时问题
5
、收敛问题
很常见,原因很多,特别是对于大系统
6
、其他具体问题
发帖人
: sdzzz
发帖时间
: 2006-10-30 16:13
1
、安装问题--出错信息就不提供了
1
)
Windows
系统
(
1
)主要是
LICENSE
问题,特别是在
Windows
系统中安装--只要把
LICENSE
,一般名为“
”拷贝到
C:Program FilesAccelrysLicensePackLicenses
即可
(
2
)注意
MS
运行时需要一定的硬盘空间来放置临时数据,所以,千万注意你
的磁盘情况;
(
3
)还有,对应于内存的虚拟内存
(
4
)服务器如果链接不上,请检查网卡是否正常;网卡正常,那请查看防火
墙设置是否正确
-----------------------
2
)
UNIX/LINUX
(
1
)
LICENSE
对于
UNIX
,
license
文件应该放在
license pack/licenses
下面,文件名应改为
file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6
材料科学论坛页码,2/18
(
2
)没有
root
帐号,不能
mountiso
文件
可以刻录到光盘上安装
(
3
)安装用户
不要用超户安装,要有普通用户
(
4
)
shell
每次进入
bash
时显示
The shell bash is not supported
计算的时候,也出现这个提示,
/home/msi/MaterialStudio/CASTEP/bin/castepexe_: error while
loading shared libraries: libmkl_: cannot open shared object file:
No such file or directory
然后退出
--》
把
ms_ -s bash
改为
sh
就可以了
(
5
)选择是否启动
Gateway
服务,一般选是
(
6
)没有制定临时文件夹
如果用的是
csh,
在安装用户根目录下修改
.cshrc(bash
用户修改
.bashrc),
内容如
下
:
eval `/home/msi/MaterialsStudio/Licensing/Setup/lic_ -s csh`
eval `/home/msi/MaterialsStudio/share/bin/ms_ -s csh`
setenv TMPDIR /home/msi/tmp
setenv
DMOL3_DATA /home/msi/MaterialsStudio/Data/Resources/Quantum/DMol3
setenv DMOL_TMP /home/msi/tmp
setenv MESODYN_HOME /home/msi/tmp
setenv PATH ${PATH}:/home/msi/MaterialsStudio/DMol3/bin
并在安装用户根目录下建一个
tmp
临时文件夹
------------------------
3)LINUX
集群
问题比较多
(
1
)
Error: Package Archive '/' does not exist
--》可以找其他正常安装的拷贝一个
(
2
)没有
root
帐号,不能
mountiso
文件
可以刻录到光盘上安装
(
3
)不能并行,只能单机版
装
cluster
还得明确指定
installtype,
加个参数
-t cluster
(
4
)
Gateway start failed - process 6194 is not running.
file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6
材料科学论坛页码,3/18
装的时候不要用
root
帐户,用自己的帐户,并且装在自己的主目录里,再启动
就不会有问题了。
(
5
)不能多节点多
CPU
并行
在
windows
下提交任务的时候总是不能选多机并行。在
Run in parallel on
选项那
里一直只能显示
1
。
--》
主要是没有指定节点,而且没有为各节点制定
CPU
数量。
要修改两个文件里面的
cpu
数目,具体路径在
../Gateway/root_default/dsd/conf
下
的
和
里把
cuptotal
改成
cluster
的数目。
--》
copy to /etc/
或者自己新建一个
内容如下:
localhost
omain
compute-0-0
compute-0-1
compute-0-2
.
.
.
compute-0-6
compute-0-7
.
.
.
在安装用户根目录下建一个
.rhosts
文件
,
内容跟
一样
---》
修改
MaterialsStudio/MPICH/share/
文件,把要用的计算节点
写上去,格式如下:
compute-0-0:2
compute-0-1:2
compute-0-2:2
.
.
.
compute-0-6:2
compute-0-7:2
.
.
.
冒号后为每个节点的
cpu
--》
修改
MaterialsStudio/Gateway/root_default/dsd/conf
下两个文件
file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6
材料科学论坛页码,4/18
中的
total cpu
否则在客户机上的
job_control
中只能看到安装节点上的
cpu
(
6
)没有
mpi
临时文件夹
rsh localhost
Trying
krb_sendauth failed: You have no tickets cached
trying normal rlogin (/usr/bin/rlogin)
Last login: Thu May 5 17:02:10 on :0
--》
mpi
没有写文件的地方
发帖人
: sdzzz
发帖时间
: 2006-10-30 16:20
2
、
GATEWAY
问题
这个好像不应该单列,但是既然单列了,就写点东西吧!
1
)
Windows
系统
(
1
)单机版
如果不准备提供其他计算机访问,可以不安装
GATEWAY
(
2
)服务器--本机
如果安装了服务器,并安装了
GATEWAY
,那么,在
MS
客户端的
GUI
程序里
面已经设置了
GATEWAY
,可以看见
LOCALHOST
项;
如果提交任务的时候失败,一般是网卡不正常,或者防火墙问题;
(
3
)提交到其他
Windows
服务器中
如果失败,可以先检查下超时时间的设置;
然后检查网络可达性;
如果对端计算机没有问题,那么,只能考虑网络上是否有防病毒措施把端口封
住了;
还可以核实下端口是否是
18888
--可以用浏览器查看下:
d:18888/
看看返回什么
2
)
LINUX
(
1
)安装时要安装
GATEWAY
(
2
)在启动中启动
其他类似上面
------------------
请高手指正补充!
发帖人
: sdzzz
发帖时间
: 2006-10-30 16:26
3
、网络问题
file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6
材料科学论坛页码,5/18
牵涉到网络问题的主要有以下几个方面:
1
)网络可达性
主要有:
*
网络的链接状态
*
网络拥塞状况
*
病毒,比如最近的
arp
病毒
*
如果服务器和客户端在一个网段,还有地址盗用问题
*
防火墙:本机,对端,交换机,路由器,网络防火墙
*
流量控制
以上很多都和学校的网络策略有关
2
)服务器
/
客户端的访问
*
用户控制
*
进程管理
*
队列
*
超时的设置
3
)并行主机之间
由于并行主机之间要交换数据,如果网络传输出现错误或故障也会导致失败
请补充!
发帖人
: sdzzz
发帖时间
: 2006-10-30 16:41
4
、计算时问题
1
)
Communication-failure
在使用
CASTEP
计算一个作业时,出现如下错误提示:
Error while monitoring job RT390: Failure in gateway communication while getting
job message.
Job Status: Communication-failure
尽管出现以上错误提示,但是此时计算机的内存及
cpu
使用仍然很高
(
cpu100
%),好像作业仍在计算。关掉那个错误提示小窗口,
Job control
窗
口中显示作业仍然处于
Communication-failure
状态。
--
>
计算大系统时,经常会出现这样的问题,多与超时,或系统繁忙有关。
a)
增加
GATEWAY
的连接时间;
b)
计算时,需要保存中间数据,默认的保存间隔对于小系统不存在问题,计算
大系统时,应该延长这个时间,比如
CASTEP
默认的是每分钟保存一次,可延
长到
2
小时或更多;
c)
一个不经意的问题是磁盘空间,大系统的计算时,会产生很大的数据文件,
尤其是在几何优化和分子动力学的计算中,磁盘空间的耗尽也会导致这样的问
题;
d)
与上一个问题相关的,系统内存的耗尽。一般地,物理内存之外,系统有虚
拟内存,如果这两者之和仍然不够使用,就会出现这样的问题;可通过
windows
的任务管理器监测,如果不够,调大虚拟内存或增加物理内存;
e) Castep & Dmol
计算的时候,自动产生存档文件和相关的目录,
Materials
file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6
材料科学论坛页码,6/18
Studio
有两个限制:一是不能使用中文目录和文件名;二是目录和文件名层层
嵌套后的总长度
<255
个字符,比如
D:MaterialsStudio2006
MS_work_dirAl6O9 FilesDocumentsAl2O3 DMol3 GeomOptAl2O3 DMol3
GeomOptAl2O3_,
这个限制来源于早期的
DOS
版本对文件路径总长度的
限制
(FFH)
,长了以后也会有这样的问题;
f
)单机运行
MaterialsStudio
应该不存在网络通讯和并行错误的问题;一般的,
不要使用
License
服务器的
License
;
2
)
Error allocating real_bands_qp in nlxc
主要可能是内存不够
3
)
Error in allocating wvfn%coeffs in wave_allocate_wv
多可能是由于系统较大,导致内存等资源不能满足要求;
可以尝试增加缓存,或在
job control
里的
optimization
选
memory
;但这不是根
本;
增加内存试试,如果不行,只能考虑更换平台,或者降低精度和系统复杂度
了。
4
)停电
这个问题比较复杂,我把自己最近查到的列下:
.........................................................
使用
CASTEP
做并行结构优化,就快结束优化的时候停电了。
这样的情况下,还是能够继续在前面已经优化的基础上继续优化。方法有如
下几种:
a
)把
OUT
文件中有关优化出来的结构信息拷贝出来,替换原来输入文件中描
述的结构的部分
(一般的作法)。大部分的程序都是每优化一步,都会写出相应这一步优化
得到的结构。
b
)如果保存着计算中的
.check
文件,仍可以继续优化。
但是只有在
standalone
的模式下计算才能得到停电这种情况下的
.check
文件,
通过
gateway
的话必须在点击
download result
以前就去临时文件夹下面
copy
。如
果你将断电前的最后得到的结构继续优化的话,得到的结果将和你原来计算的
结果有差异。这是因为如果你是按断电前的结果优化,就等于是一个新的结构
优化计算,这个计算的结果可能会和不断电的情况下得到的结果有差异。但是
未必这样的结果就不准确,能不能用要靠你对计算的结果进行分析了,这个要
看具体的情况,
.check
文件在的话只是说你可以按照断电前的情况继续算下
去,就是说应该是和没断电的结果是一样的。
在
.castep
和
.geom
两个文件中都有结构坐标,但是这两个文件中的坐标不一
样,不知道该用哪一个文件中的坐标。
还有,是不是用上述文件中的结构坐标代替所有
.cel
文件中的坐标,然后就可
以继续进行结构优化。
file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6
材料科学论坛页码,7/18
5
)其他计算时的出错
一般来说,小系统出现计算溢出或其他错误的可能要小些,对于具体的出错,
可以先看看是不是和系统资源有关系。
发帖人
: sdzzz
发帖时间
: 2006-10-30 17:02
5
、收敛问题
很常见,原因很多,特别是对于大系统
一般来说,小系统出现计算溢出或其他错误的可能要小些,对于具体的出错,
可以先看看是不是和系统资源有关系。
1
)
SCF
最大仍不收敛
一般来说,
MS
默认的
SCF
次数
100
对于小系统是够用的,但是,原子数一多,
就不一定了。
a)
首先结构的合理性,如果自建的结构偏离最低能量太大(或失配度太大),
可能会难以收敛
b)
取消一切对称性,充分驰豫晶格
c)
有些结构本身就是亚稳态,
scf
的各项收敛指标如果设的太高,对于亚稳态就
可能达不到如此的精度。
d)
改变收敛的条件,降低精度
(
能量的截断值
)
e)
增加循环次数
f)
改变赝势
2
)对于绝缘体,可以设置能带占据情况的
OPTION BOX
;
3
)磁性材料的自旋设置;
4
)
supercell
可以增加长度尺寸
5
)过渡元素,重元素等
f
层电子问题;
相对论修正问题。
6
)未找到基态能
在计算过程中经常遇到计算失败的情况,文件给出的警告是:
*Warning* max. SCF cycles performed but system has not reached the groundstate.
Warning: electronic minimisation did not converge when finding ground state.
-->
参照上面
和收敛有关的参数主要有能量的
CUTOFF
,
SCF
的次数,
SMEAR
,以及
K
点选
取等,可以尝试一下。
7
)优化不收敛
增加设
tions
的大小
interations
是定义积分精度的,相当于
gaussian
里的
int
选项;根据
gauss
的经验,
file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6
材料科学论坛页码,8/18
对重原子如果不用细的积分网格,结果就不准确,特别是频率计算,可能会把
正的频率算成负的频率。提高
interations
的确可以提高精度,特别是对于过渡
态和频率计算。
3
)优化后计算性能参数,还要再优化
目前据我的理解是,可能是计算几何优化的时候选取的一些参数和计算性能,
比如能量时的不同。
目前我还不清楚,请各位达人给出解答。
6
)总能和文献不一致,而且多种方法都不同
很正常,只要相对值近似就可以
在倒空间进行电子结构计算的方法中
,
都存在一个能量零点的取法的问题
,
不同
的程序
,
取的不同
.
根本原因是
V(G)
在
G=0
是发散的
(
可以去
R.T. Martin
的电子结
构那本书
).
castep
是利用周期性
,
在倒空间进行电子结构计算的
.
我没有记错的话
,Dmol3
是在
实空间来进行电子结构计算的
.
能量零点的取法就跟不同前者了。
因此在进行电子结构计算中,不要比较任何绝对能量值的大小,这样是毫无意
义的,即使是同一个程序中也是这样,更不用说是两个不同的程序。
能量的相对值才具有物理意义。
发帖人
: sdzzz
发帖时间
: 2006-10-30 17:11
6
、其他问题
有很多了。
比如:
*
优化时同时选择计算能量,与优化后再计算能量,为什么得到的结果不同;
*
用
ULTRAFINE
进行优化,计算能量,同时选择计算光学性质,为什么和试验
数据差别这么大
*
赝势的选择问题
*
如何计算特定温度下的材料性能参数
*... ...
大家可以举出很多问题,希望能够加强交流,共同进步!
发帖人
: sdzzz
发帖时间
: 2006-10-30 20:09
由于本人接触
MS
的时间比较短,很多东西还懵懵懂懂的,不甚了了,所以,
还请各位学兄学弟学姐学妹前辈高人们多多指教。如果大家有什么问题或者什
么经验,千万放上来,共同进步岂不是更好!
发帖人
: cbFeng200881
发帖时间
: 2006-10-31 17:09
谢啦 哥们
本人体会:
MS
貌似简单,实则难亦!
发帖人
: progressing988
发帖时间
: 2006-10-31 17:22
file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6
材料科学论坛页码,9/18
sdzzz
,你真好,!一定支持你。
发帖人
: sdzzz
发帖时间
: 2006-10-31 20:09
引用
:(cbFeng200881 @ 2006-10-31 17:09)
谢啦
哥们
本人体会:
MS
貌似简单,实则难亦!
是啊,和理论功底不够扎实也有关系!
想想自己过去学得还是不好
... ...
发帖人
: sdzzz
发帖时间
: 2006-10-31 20:43
希望各位同学积极跟贴。
将自己的经验和遇到的相关问题贴出来,大家一起分享。
发帖人
: sdzzz
发帖时间
: 2006-11-05 16:50
VAMP
常见错误及原因
--------------------------
by Sunkiller
--------------------------
1 VAMP
任务运行失败(
If a VAMP job fails
)
MS
会在任务运行前检查绝大多数数据及参数设置,如果设置不合要求,
MS
会提示出错及出错原因,用户可以根据提示在
VAMP Calculation
对话框
中修改参数设置。
但是有些任务在运行前检查无错,在运行过程仍会出错。这种情况下,出
错信息会在中显示或只在输出文件中显示。服务器任务目录中保存的文件也
会对分析出错原因有所帮助,可是使用服务器控制
Server Console (Tools
|Server Console)
来查看这些文件。
以下内容为常见出错原因,可以帮助用户纠正常见错误。
提示:可以使用
View | Project Log
来及时查看错误信息或警告信息。
1.1
不能运行任务:
Run
按钮灰色不可用(
Cannot start a VAMP job: Run
button is grayed out.
)
1
. 当前文件不是
3D
结构文件。如果当前文件不是
3D
结构文件如图表文
件或文本文件,则
Run
按钮呈现灰色不可用,此时可以激活
3D
结构文
件使之为当前文件,则
Run
按钮可用;
2
. 当前文件为周期性结构。
VAMP
只能对单个分子进行操作。
1.2
不能运行任务:网关与网络问题(
Gateway and network communication
problems
)
VAMP
任务不能运行的大多数问题都源于此。
1
. 客户端的网关没有注册:在客户端安装的
MS
不设置远程服务器地址,
用户可以用
Server Console
检查网关注册情况,也可以用它添加网关;
2
. 可用服务器的客户端网关没有注册:
VAMP
需要服务器程序才能运行
file://C:Documents and SettingsArthur桌面材料科学论坛.htm2007-4-6
材料科学论坛页码,10/18
任务,且只有服务器网关被选中才能运行,用户可以用
Server Console
查看可用服务器的网关设置;
3
. 本地网关过期:网关信息保存在相应的网关中,它包含可用服务器的
基本信息。当通过
Server Console
在
PC
机上注册一个新的网关时,服
务器列表被拷贝到客户端
PC
机上。但当添加一个新的服务器或从网关
删除一个服务器时,
PC
机上的网关信息仍保存,所以必须更新才可使
用,可以通过
Server Console
更新;
Sunkiller
编辑整理,更多内容请来材料科学论坛
Sunkiller
编辑整理,更多内容请来材料科学论坛
4
. 网关不可用:如果计算机的网关关闭或网关程序出错,则任务不能运
行,用户可以选择不同的网关进行运算,通过
Server Console
进行设置;
5
. 网络问题:
MS
需要与网关进行交流,如果网络出现问题,则任务不能
进行。用户可以用
Server Console
检查网关是否开通及是否运行,如果
用同一网关在不同的
PC
机上能进行任务,则说明是
PC
机的问题;
6
. 分离服务器管理程序(
Disconnected Server Manager program
,
DSMgr
)
问题:
MS
与网关的交流通过分离服务器管理程序完成,此程序为后台
运行且不能直接查看,但以下特征可能说明该程序处问题:


发布评论