2024年2月10日发(作者:)

MS Linux 集群安装手记

1、root 用户挂载iso光盘镜像:(超算中心帮助)

# mount -o loop -t iso9660 (GPU集群上iso镜像已挂载,在目录/mnt下)

安装hpmpi:(在目录/mnt/UNIX/Linux_x86_64/hpmpi下)

#rpm -ivh/hpmpi-2.03.01.00-20090402r..rpm

2、安装程序:

切换到用户账户,切换到安装目录里LINUX目录,运行

Install --type cluster命令一路回车,注意在选择是否使用ssh时选择是,否则不能共享内存,在选择临时文件夹时不要选择./tmp,使用默认就好。安装完后选择99,退出。

3、安装license:

切换到目录~/Accelrys/LicensePack/linux/bin目录下,运行lp_install命令,格式为./lp_install

4、修改:

编辑目录~/Accelrys/MaterialsStudio55/share/data下的文件,添加各节点及其核心数并保存。

5、修改gateway数据:

编辑目录~/Accelrys/MaterialsStudio55/etc/Gateway/root_default/dsd/conf下的和文件,将其中的cpu总数改成文件中的总核心数,并将

6、配置ssh:

进入目录~/.ssh,编辑其中的known_hosts文件,将各节点全部添加进去(密匙相同)。(用户目录下用ls–a命令可以看到以“.”开头的文件或目录。)

7、进入Gateway目录运行./gwrestart重新启动gateway。

8.首先把license装好,不然启动不了gateway,再把、known_hosts文件和gwdata配置好,重启网关就可以了,附件中已经说明。其中gwdata也可以在web下修改:登录到安装ms的地址:,点Gateway Data、Edit(默认用户名是gatekeeper,无密码),然后就可以编辑gwdata了(修改cpucorestotal和installedmemory)。

8.排队系统启用:进入目录/etc/Gateway/config,运行

./configure queue -queuepath LSF/dsd_lsf -activate命令,重启网关。

或者是:

/public/home/guanzy/Accelrys/MaterialsStudio55/etc/Gateway/root_default/dsd/commands/queues,先将torque 上传至此目录下,注意是将torque目录里边的TORQUE上传。然后,运行如下命令。

./configure queue -queuepathTORQUE/dsd_torque -activate

9.在客户端刷新gateway data应该就可以提交作业了。

10对网关进行加密:

先停掉gw ,在gw目录下运行./gwauthenticationpassword

默认的用户就一个,是gatekeeper ;密码可以改运行./gwusers /updata

gatekeeper ;刷新gw时候会提示输入用户名和密码

以后在这个gw下提交任务就不会提示了。添加或者删除用户运行./gwusers

/update <新用户名>;删除运行./gwusers /remove

取消密码保护./gwauthentication minimum 。

修改改密码或者添加删除用户不用停掉网关,其他的要先把网关停掉。

Linux端打开web访问端口:

vi /etc/sysconfig/iptables-config

在其中加入:

iptables -A INPUT -j ACCEPT -i eth1 -p tcp --dport 18888

iptables -A RH-Firewall-1-INPUT -m state --state NEW -m tcp -p tcp --dport 18888 -j

ACCEPT

先停止防火墙服务:

/etc/目录下的:

serviceiptables stop

然后重启防火墙:

serviceiptables start