2024年3月23日发(作者:)
Materials Studio Linux集群安装手册
一、安装Linux操作系统,进行系统配置
一般都建议最小化安装,不用安装图形界面。下面我以red hat
enterprise linux 6.0 x86-64在AMD Athlon(tm)64 X2 Dual Core Processor
4400+ 电脑上的安装为例。rhel6.0的安装过程和windows差不多,一路下
一步(或Next)基本就ok了,在您要进行哪种类型的安装?你如果是第一
次安装,是新硬盘的话可以选使用所有空间,并勾选下边的查看并修改分
区布局,然后下一步,你可以看下大概的分区情况,在Red Hat Enterprise
Linux 的默认安装是基本服务器安装。如果对Linux不太熟的话,最好选
择软件开发工作站(或Software Development Workstation),这样基本上
把要用的软件都安装上了,然后再选上下边的现在自定义(或 Customize
now),再下一步,然后把所有能选上的软件都选上,再一路下一步。安装
完以后,创建一个非root用户,比如创建一个msi用户,root和msi用户
密码设的简单一些比较好,别一会儿你自己都忘了,我是root和msi用的
一个密码,当然将来你自己真正组建集群用于计算的时候再设置复杂一些,
这样课题提高系统的安全性。
gcc
glibc-2.3.4-2.43 (32-bit and 64-bit)
libgcc-3.4.6-11 (32-bit and 64-bit)
libstdc++-33-3.4.6-11 (32-bit and 64-bit)
compat-libstdc++-33-3.2.3-47.3 (32-bit)
hpmpi-2.03.01.00-20090402r.x86_64
这几个补丁,好像除了hpmpi-2.03.01.00-20090402r.x86_64和
libstdc++-33-3.4.6-11 (32-bit)没有装上之外,别的都给你装好了。这里要说
的是,这些补丁每个节点都要装,千万记住。你可以用命令: rpm -qa|grep gcc
查询,当然你要查libstdc++就要用命令:rpm -qa|grep libstdc++了。对于
hpmpi-2.03.01.00-20090402r.x86_64和libstdc++-33-3.4.6-11 (32-bit)的安
装可以用命令rpm安装,首先切换到这两个软件包所在的目录下,执行下列命令,
格式如下:
rpm -ivh libstdc++-
rpm -ivh hpmpi-2.03.01.00-20090402r.x86_
注意,这里都是在root用户执行的操作,
二. 为msi用户添加sudo命令使用权限,运行命令 su root,
输入root用户的登录密码后,使用vi命令进行下面的修改:
在root权限下,运行命令:vi /etc/sudoers
#在root ALL=(ALL) ALL这一行下面添加一行msi ALL=(ALL) ALL
然后运行命令::wq!
#在命令模式下,强制执行存盘退出操作
注:修改后,则成功添加msi用户使用sudo命令的权限,在往后的安装中可方
便进行提权操作。
三. 于各节点安装HP-MPI,安装方法:
a. 挂载MS安装光盘,对应系统版本进入下列相应目录进行
安装,下面是版本信息:
1 :UNIX/Linux/hpmpi/ for older IA32 Linux
2 :UNIX/Linux_x86_64/hpmpi/ for IA32 Linux systems with x86_64
3 :UNIX/Linux_IA64/hpmpi/ for IA64 Linux.
b. 安装时需要使用root用户进行安装,终端运行su root
后输入密码登录为root,使用下面安装命令:
1 :rpm -ivh /UNIX/Linux_x86_64/hpmpi/hpmpi-2.03.01.00-20090402r.x86_
c. 安装后出现下面提示即成功安装
四
.查看各节点网络状态,修改主机名
可以使用ifconfig命令,查看各个节点的网络状态。rhel6.0开机
后网络是处于禁用状态,要激活网络接口,可以使用命令:ifcf
g eth0 start或ifup eth0。一般情况下rhel6.0在安装的过程中都
可以认出主机的网卡,如果由于网卡太新没有认出来,那就需要
到网卡官方网站下载Linux网卡驱动程序进行安装了,网上教程
很多很容易掌握。使用hostname指令设置主机名。在命令行中
输入下面的命令:hostname msinode1
注意:使用hostname指令设置的主机名称仅在系统重新启动前
起效,重启系统后将使用原来的主机名称。如果希望启动系统后
生效,则需要修改文件“/etc/hosts”。
五. 配置SSH免认证登录,配置过程:
a. SSH免认证登录的配置:
i. 测试是否已经安装SSH,于终端(Terminal)中输入ssh local
host后回车,若出现下面提示:
则表示已经安装SSH。若提示失败,则需要放入安装光盘进行安
装。
ii. 于终端中输入ssh-keygen -t rsa,此时它会提示你生成SSH的
密钥。
iii. 此时无须设置密码,你只需要点击回车就可以了,生成的公
钥和私钥会保存~/.ssh/目录下。
iv. 进入目录~/.ssh/(命令:cd ~/.ssh/),运行命令:
1 :cp id_ authorized_keys,将公钥进行复制。
v. 同样地,在其他节点上运行上面的命令,将各节点中得到的autho
rized_key中的内容复制出来,汇总到一个文件中,命名为authorized
_key,并放置于各节点的~/.ssh/目录下(覆盖原有文件)。
#可以在xp下使用WinSCP软件进行管理,就像处理word文档一样复
制粘贴就行了,每个节点的authorized_key内容在汇总的
authorized_key里各占一行。
vi. 修改.ssh/目录下的文件权限以及目录权限,运行命令:
1 :chmod 600 *
2 :chmod 700 .
vii. 再修改home目录的权限为只读,运行命令:
1 :cd ~
2 :chmod 755 .
viii. 在各节点的对应目录重复以上命令,如成功的话,对localh
ost(或者其他节点机器名)进行ssh连接则不会再出现密码提示,
如图:
ix. 为加快SSH连接速度,使用 vi 命令(需要root权限)修改
各个节点的 /etc/hosts文件,运行下列命令:
1 :sudo vi /etc/hosts
显示如下:
1 :# Do not remove the following line, or various programs
2 :# that require network functionality will fail.
3 :127.0.0.1 omain localhost
4 :::1 omain6 localhost6
5 :192.168.2.160 mscnode1
6 :192.168.2.161 mscnode2
x. 将127.0.0.1后对应的主机名删除,添加集群中各节点的IP地
址和机器名,保存后退出即可,示例如下所示:
1 :# Do not remove the following line, or various programs
2 :# that require network functionality will fail.
3 :#127.0.0.1 omain localhost
4 :
5 :192.168.128.160 mscnode1
6 :192.168.128.161 mscnode2
7 ::w #保存,如果显示无法保存可以在w后加!强制执行
8 ::q #退出
xi. SSH免认证登录可使用WinSCP软件进行简化。
六. 以集群模式安装MS
1. 先将MS文件上传到主节点。可以以打包的形式上传,也
可以先做成ISO,我一般是习惯先做成ISO上传,以免出现
权限不够的问题,遇到权限不够的时候改变文件属性,加上
执行权限就可以了。
2. 上传后将ISO文件挂载到某一目录下,如果想挂到根目
录下mnt目录下的iso目录中,命令示例如下:
1 :mkdir /mnt/iso
2 :mount -o loop -t iso9660 ms50_ /mnt/iso
3. 在主节点上切换到MS安装用户,这里用的是hope,然
后到换到/mnt/iso/UNIX下执行
1 :./Install --type cluster
2 :或是直接./mnt/iso/UNIX/Install --type cluster
--type cluster这个参数是并行时必须加的参数,另一个要注意的
就是要用非root用户安装。
4. 如果执行上述命令后出现无法安装的提示,可使用下列命
令进行提权:
1 :chmod 777 /mnt/iso/ -R
5. 安装过程中其他基本上用默认的就可以,但有一个临时文
件夹建议不要放在共享目录下,每个节点放一个tmp,这样
可以减少节点间的通信量,提高性能。
比如说我的安装目录是/home/hope/Accelrys/MaterialsStudio5
0,Accelrys是我要共享给其他节点的目录,那tmp我就放在
/home/hope/下,用MS的用户创建,保证可写入。其他每个
节点的用户目录下都创建一个tmp目录。
6. 安装完成后将Accelrys目录共享给其他节点,方法如下:
1 :vi /etc/exports #加入下面一行内容:
2 :/home/msi/Accelrys *(rw,no_root_squash)
7. 然后重启nfs服务,service nfs restart。如出现错误提示,
则参考《Linux下配置安装NFS》文章中检查portmap服务
是否已经启动或者运行命令是否有root权限。
1)NFS服务所需的套件
(1)portmap
运行命令查询portmap是否安装:rpm –qa |grep portmap
#显示portmap-4.0-65.2.2.1表示已正确安装
(2)nfs-utils
运行命令查询nfs-utils是否安装:rpm –qa |grep nfs-utils
#显示一下内容表示已正确安装
nfs-utils-lib-1.0.8-7.2.22
5
2)启动NFS服务
NFS服务要正常运行,必须先启动portmap服务。使用以下
命令就可以启动NFS服务:
service portmap start
service nfs start
3)停止NFS服务:
service smb stop
4)重启NFS服务
service smb restart
8. 然后到其他节点上使用root用户登录,执行挂载命令:
1
:mount -t nfs 主节点名或iP地址:/home/hope/Accelrys/ /home/hope/Accelrys/
若出现错误提示,则检查该节点是否已经新建Accelrys文件夹、
防火墙是否已经关闭以及SELinux功能是否已经关闭。
9. 导入
证书。在安装光盘中找到文件,将licenses文件中里
第一行中的机器名改为你的主节点的机器名后,文件名改为
放到/home/hope/Accelrys/LicensePack/Licenses里。在
Terminal中运行:
1
:./home/hope/Accelrys/LicensePack/linux/bin/lp_admin
然后在图形界面下进行证书的导入。
如果没有图形界面的话,使用下面命令可以启用命令行的
Licenses administration Tools:
1 :
2 :
3 :
10. 修改/home/hope/Accelrys/MaterialsStudio50/share/data
下的,写上各节点的机器名:CPU数。
11. 修改/home/hope/Accelrys/MaterialsStudio50/etc/Gatewa
y/root_default/dsd/conf里两个文件里的CPU数为你各节点
CPU总数。
12. 重新启动网关,进入/home/msi/Accelrys/MaterialsStudio5
0/etc/Gateway,执行
:./msgateway_control_18888 restart
1
13. 由于之前安装的时候没有将Gateway注册为自动启动服
务的话,可执行下面的命令:
1:cp /home/hope/Accelrys/MaterialsStudio55/etc/Gateway/msgateway_control_18888
/etc/rc.d/init.d/msgateway_control_18888 #接上一行
2:再执行命令:
/sbin/chkconfig --add msgateway_control_18888
14. 至此,MS的集群安装基本完成
15. 备注:
1. 防火墙配置要注意,测试时请先关闭防火墙及SELinux
Linux关闭防火墙
1)重启后永久性生效:
开启时执行命令: chkconfig iptables on
关闭时执行命令: chkconfig iptables off
2)即时生效,重启后失效:
开启时执行命令: service iptables start
关闭时执行命令:service iptables stop
关闭SELinux的方法:
修改/etc/selinux/config文件中的SELINUX="0" 为
disabled ,然后重启。如果不想重启系统,使用命令setenforce
0。
#也可以在X-windows下进行配置
2. SSH免认证配置需要仔细进行权限配置,一般出问题了都
是权限的问题。
3. 上述过程中,NFS和Portmap服务没有注册为自动启动,
nfs共享目录也没有进行自动挂载,当节点关机后需要重新
进行挂载。同样,License服务也没有注册为系统服务,重启
后可能需要重新启动License认证服务。
4. 关于Lniux的安装过程以及VMTools的安装待续。
七. 在windows下添加materials studio集群计算的Gatewa
y
1. 打开Tools下的Server Console
2. 新建一个Server Gateway
3. 在下图中输入主节点的IP地址,再Run Diagnostics,
如果显示SUCCESS,再点ok,完成windows和linux集群的
连接
4.在linux下输入文件名或路径的时候可以输头几个字母,
在按Tab键进行自动补齐,可以提高工作效率,“#”后的
都表示注解内容


发布评论