2024年3月19日发(作者:)

VirtualBox环境下基于多台Ubuntu虚拟机的Hadoop

分布式计算环境搭

安装虚拟机首先要在vbox中建立Ubuntu系统,无论主机的操作系统是

windows还是linux都不要紧,我们之后举行的全部操作都只在虚拟机

的ubuntu中举行。因为是在虚拟机中安装,就没有硬盘安装ubuntu

那样棘手了。上官网把下好,放在本地文件夹中,

启动vbox,新建一个子os,选项都很容易,网卡设置为host-only,

从之前下载的iso镜像启动。启动后的安装步骤在这里不再赘述,如有

疑问请参照我之前的一篇文章。当第一个虚拟机建好后,不要用法同样

的办法建立其次个ubuntu系统,vbox为我们提供了简便的复制办法,

在Teinal中输入do vboxmanage clonevdi []

[];就可以彻低克隆一个os,之后new一个os,在挑

选硬盘那里找到刚clone的作为硬盘即可。我们用这

种办法建立3台虚拟机,分离命名为UB01,UB02和UB03,它们的用户

名必需全都,这里设置为vbox,为了容易,密码也统一设定为vbox。

举行到这里,可以用查看三台虚拟机的ip地址,正常的话它们的ip

各不相同,且互相之间可以通,到这里就完成了第一步。 安装配置

ssh仅仅能ping通还是不够的,为了完成分布式计算系统,需要三台

机器互相之间可以无密码拜访(或者是master可以无密码拜访2个

slave)。首先在三台虚拟机上安装ssh-openserversudo apt-get

install ssh rsy完成后,在个人名目/home/vbox/下新建.ssh文件夹,

在.ssh中执行ssh-keygen -t rsa系统会问你一些配置,因为是初次

试验,不需要这些内容,点回车继续下去即可。完成后会在.ssh/下生

成_rsa和id_两个文件,三台机器做同样处理。忘了一件事,

需要配置三台机器的别号,这样就不用通过ip互访了,打开

/etc/hosts,清空里面的内容,写入127.0.0.1 localhost

omain localhost192.168.56.101 UB01

omain UB01192.168.56.102 UB02192.168.56.103 UB03

第 1 页 共 3 页

对于UB01按如上书写,对于UB02如下,UB03则可一并推出(这里的每

一个ip地址都应当是ifconfig后看到的,因机而异)127.0.0.1

localhost omain localhost192.168.56.101

UB01192.168.56.102 UB02 omain UB02192.168.56.103

UB03设置完别号,可以互相ping一下看看是否生效,这里ping的对

象就不是ip地址而是别号了。接下来把它们的密钥互相交换,如在UB01

中执行s ~/.ssh/id_

vbox@UB02:/home/vbox/.ssh/id_01scp

~/.ssh/id_ vbox@UB03:/home/vbox/.ssh/id_01这

样做的目的是把UB01的密钥交给UB02和UB03,对UB02和UB03做同

样处理,完成后每一个机器的/.ssh/中应当有3个密钥,一个是自己的,

另两个是别人的,把自己的密钥连同别人的两个密钥加到授权密钥中

(对UB01) id_ authoriz_keys;cat id_02

authorized_keys;cat id_03 authorized_keys;对其它两台

机器做同样处理。接下来检验互相之间是否可以通过ssh实现无密码

拜访,在终端输入(对UB01)ssh UB02;ssh UB03;拜访胜利会现实欢

迎信息,初次拜访需要yes,之后就可以不挺直拜访了。 安装jdk在

Ubuntu系统中安装jdk的办法我只简述一下,有困难者请google之,

网络上资源多多。首先下载对应版本的jdk,下载完成后把.bin包移

动到个人名目/home/vbox/,执行 u+x ;sudo

-s ./;等待安装完成,会在当前路径生成jdk名目,接

下来设置环境变量,在/etc/pro/中添加JAVA_HOME、JRE_HOME、

CLASSPATH和PATH的值,reboot后在Terminal输入java -version

会看到版本信息,证实安装胜利。为了备忘,环境变量的配置还是写

在下边吧JAVA_HOME=/home/vbox/jdk1.6.0_25

JRE_HOME=$JAVA_HOME/jreexport

CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATHexpoet

PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH 安装hadoop将下载到

第 2 页 共 3 页

的移动到个人名目/home/vbox/,执行安装操作

tar -xzvf 会在当前路径生成hadoop文件夹,

接着修改文件夹全部者 vbox:vbox hadoop-0.20.2随后把hadoop的环

境变量加入到/etc/profile中,添加如下内容export

HADOOP_HOME=/home/vbox/hadoop-0.20.2export

PATH=$HADOOP_HOME/bin:$PATH接下来需要修改hadoop/conf/名目下

的配置文件,共有6个文件需要修改,分离是masters、slaves、

、、、,修

改如下文件mastersUB01文件slavesUB02UB03文件

configuration property name /name value

/home/vbox/tmp /value description As you like /description

/property !--file system properties-- property name

/name value hdfs://UB01:9000 /value

/property /configuration 文件 configuration

property name /name value UB01:9001 /value

/property /configuration 文件 configuration

property name ation /name value 1 /value

/property /configuration 文件在末尾添加export

JAVA_HOME=/home/vbox/jdk1.6.0_25解释几个地方,以上几个文件中

详细的版本号、路径与ip地址要按照各自虚拟机信息区分配置,不要

把我的ip抄到你的文件里,没用的。注重中设定为1

的value是最小节点数,之前为3,会浮现2个slave运行不能的状

况,以上配置信息对UB01、UB02和UB03彻低全都。

第 3 页 共 3 页