hadoop怎么配置(Hadoop的核心配置是什么)
本文目录
Hadoop的核心配置是什么
【答案】:Hadoop的核心配置通过两个xml文件来完成:1,hadoop-default.xml;2,hadoop-site.xml。这些文件都使用xml格式,因此每个xml中都有一些属性,包括名称和值,但是当下这些文件都已不复存在。
Hadoop集群配置
切换到Hadoop解压目录的etc/hadoop/目录下,hadoop-env.sh,修改如下内容: 该文件是Hadoop的核心配置文件,目的是配置HDFS地址、端口号以及临时文件目录。 该文件MapReduce的核心文件,用于指定MapReduce运行时框架。在etc/hadoop/目录没有该文件,需要将mapred-site.xml.template复制并重命名为mapred-site.xml。该文件YARN的核心文件,需要指定YARN集群的管理者。 该文件记录Hadoop集群所有从节点(HDFSde DataNode和YARN的NodeManager所在主机)的主机名,用来配合一键启动脚本启动集群从节点(保证关联节点配置了SSH免密登录)。打开slaves文件,先删除里面的内容(默认localhost),配置如下内容 完成Hadoop集群主节点hadoop01的配置后,还需要将系统环境配置文件、JDK安装目录和Hadoop安装目录分发到其他子节点hadoop02和hadoop03上,具体指令: scp /etc/profile hadoop02:/etc/profile scp /etc/profile hadoop03:/etc/profile scp -r /export/ hadoop02:/ scp -r /export/ hadoop03:/ 完成后,在hadoop02和hadoop03节点刷新配置文件: source /etc/profile 初次启动HDFS集群时,必须对主节点进行格式化处理。注意:格式化指令只需在Hadoop集群初次启动前执行即可。指令: hdfs namenode –format 或 hadoop namenode -format 出现“successfully formatted"字样表示格式化成功。 针对Hadoop集群的启动,需要启动内部包含的HDFS集群和YARN集群两个集群框架。 启动: (1)start-dfs.sh #启动所有HDFS服务进程 (2)start-yarn.sh #启动所有YARN服务进程 或者: start-all.sh直接启动整个Hadoop集群服务 关闭则直接将上述指令中的start换成stop即可。 在整个Hadoop集群服务启动完成后,可以在各自机器上通过jps指令查看各节点的服务进程启动情况。 集群启动成功。
如何配置Hadoop环境
详细环境配置介绍如下:Hadoop版本为0.20.2.JDK版本为1.6.0.操作系统为FreeBSD8.0(最小化安装)vc3(192.168.1.3)是Namenode(Master),其他三台作为Datenode(slave).Hadoop是Java语言编写的机群程序,他的安装时建立在ssh和JDK之上的,所以在配置Hadoop之前首先要对系统进行ssh和JDK的安装与配置。1.下面首先来通过ssh来实现Hadoop节点之间用户的无密码访问。(1).在各个节点的/etc/hosts文件中添加节点IP及对应机器名,并在各个节点上建立相同用户名与密码的账户。修改/etc/hosts文件如下:192.168.1.1 vc1192.168.1.2 vc2192.168.1.3 vc3192.168.1.4 vc4修改成功后就可以实现IP地址与机器名的对应解析。在各个节点建立用户名为Hadoop,密码为123456的用户。(2).实现节点间通过ssh无密码访问。在vc3的/home/hadoop目录建立.ssh目录。mkdir .ssh //建立.ssh目录在/home/hadoop目录下进行ssh配置。ssh-keygen -t rsa //生成密匙对cd /home/hadoop/.sshcp id_rsa.pub authorized_keyschmod go-rwx authorized_keys //要正确设置文件的权限644(即go-rwx)scp -r /home/hadoop/.ssh vc1:/home/hadoop //将vc3中的.ssh文件夹内容复制到vc2节点的相同位置去。scp -r /home/hadoop/.ssh vc2:/home/hadoop //同上scp -r /home/hadoop/.ssh vc4:/home/hadoop //同上(3).测试是否配置成功同过ssh+机器名命令测试能否无密码访问其他计算机,如果无密码访问则配置成功。例:vc1使用ssh vc3是否能无密码访问vc3,vc3使用ssh vc1是否能无密码访问vc1。(其他主机方法类似)2.JDK的安装在这里利用ports安装JDK。在安装时要先下载如下几个文件:jdk-1_6_0_16-fcs-bin-b02-jrl-28_may_2008.jarjdk-1_5_0_16-fcs-src-b02-jrl-28_may_2008.jartzupdater-1_3_12-2009a.zipbsd-jdk16-patches-9.tar.bz2diablo-caffe-freebsd7-i386-1.6.0_07-b02.tar.bz2到usr/ports/distfiles/目录,然后进入/usr/ports/java/jdk16进行安装。在这里需要说的是在安装JDK的时候最好安装最新版本,即1.6.0,否则在后面的Hadoop运行过程中可能会出错。cd /usr/ports/java/jdk16 //进入jdk安装目录make install clean //安装jdk还有一种安装方法是去Sun官网下载JDK软件包jdk-6u12-Linux-i586.bin进行安装。(我没试过,不知道行不行,只是提一下。)把下载的JDK软件放到/home/hadoop目录下,给软件加上可执行权限,如下:chmod a+x jdk-6u12-Linux-i586.bin运行jdk-6u12-Linux-i586.bin进行安装。./jdk-6u12-Linux-i586.bin安装完成后会在当前目录生成jkd1.6.0_12文件夹。把生成的文件夹复制到/usr/java文件夹中。mkdir /usr/java //新建java文件夹cp -r jkd1.6.0_12 /usr/java下载设置环境变量,修改/etc/profile文件。在该文件中添加如下代码:export JAVA_HOME"/usr/java/jkd1.6.0_12"export PATH="$PATH :$JAVA_HOME/bin:$JAVA_HOME/jre/bin:"export CLASSPATH ="$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib"保存后键入命令:source /etc/profile使环境变量设置生效。安装好JDK后可以通过which命令来测试JDK是否安装成功:which java若是第一种方法显示信息如下:/usr/local/jdk1.6.0/bin/java如是第二种方法显示信息如下:/usr/java/jkd1.6.0_12/bin/java3.下来进行Hadoop的安装和配置。下载hadoop-0.20.2.tar.gz到/home/hadoop目录,并解压:tar -vxzf hadoop-0.20.2.tar.gz //解压hadoop到当前目录解压完后进入/home/hadoop/hadoop-0.20.2/conf目录进行配置。cd /home/hadoop/hadoop-0.20.2/conf(1).修改hadoop-env.sh配置文件如下:export JAVA_HOME=/usr/local/jdk1.6.0(2).修改masters和slaves配置文件如下:masters文件:192.168.1.3slaves文件:192.168.1.1192.168.1.2192.168.1.4(3).修改core-site.xml文件如下:《?xml version="1.0"?》《?xml-stylesheet type="text/xsl" href="configuration.xsl"?》《!-- Put site-specific property overrides in this file. --》《configuration》《property》《name》fs.default.name《/name》《value》hdfs://202.113.88.73:9000《/value》《/property》《property》《name》hadoop.tmp.dir《/name》《value》/tmp/hadoop/hadoop-${user.name}《/value》《/property》《/configuration》(4).修改hdfs-site.xml文件如下:=====line 1 col 0 lines from top 1 ============================================《?xml version="1.0"?》《?xml-stylesheet type="text/xsl" href="configuration.xsl"?》《!-- Put site-specific property overrides in this file. --》《configuration》《property》《name》dfs.replication《/name》《value》1《/value》《/property》《/configuration》(5).修改mapred-site.xml文件如下:《?xml version="1.0"?》《?xml-stylesheet type="text/xsl" href="configuration.xsl"?》《!-- Put site-specific property overrides in this file. --》《configuration》《property》《name》mapred.job.tracker《/name》《value》202.113.88.73:9001《/value》《/property》《/configuration》配置文件修改完毕后格式化Namenode(运行Hadoop之前必须先进行格式化),进入/home/hadoop/hadoop-0.20.2/目录,命令如下:./bin/hadoop namenode -format格式化完毕后就可以运行Hadoop了,命令如下:./bin/start-all.sh //在/home/hadoop/hadoop-0.20.2/目录下运行如果要停止运行如下命令:./bin/stop-all.sh //在/home/hadoop/hadoop-0.20.2/目录下运行到此,Hadoop的配置已经完成了.
如何配置一个环境变量HADOOP
1)载并解压hadoop-0.20.203.0.修给解压文件夹名字hadoop-0.20.2032)按述所示hadoop-0.20.203/bin路径加PATH环境变量sudo gedit/etc/profile3)修改配置文件配置文件都hadoop-0.20.203/conf目录a.进/hadoop-0.20.203/conf/hadoop-env.sh解注释JAVA
本文相关文章:
phpstorm配置xdebug(如何在xampp环境下配置phpstrom xdebug)
2024年9月10日 02:30
oracle11g 数据库创建失败(oracle 11g_r2 创建数据库时 Enterprise Manager 配置失败)
2024年9月6日 19:50
centos7网卡配置(centos 7虚拟机怎么配置网卡eno 16)
2024年8月31日 12:35
xml常用标签(web.xml文件主要配置有哪些,都有什么含义)
2024年8月26日 11:20
feignclient(Feign Client超时时间配置以及单独给某接口设置超时时间方法记录)
2024年8月20日 09:55
hibernate二级缓存有什么用(如果不配置hibernate的二级缓存的话,是不是就体现不出hibernate的优越性)
2024年8月16日 14:55
vscode配置python(mac下VScode怎么配置编译Python)
2024年8月11日 06:07
java获取项目中的文件(java文件怎么获取项目下的配置文件)
2024年8月9日 18:30
centos java环境配置(如何在阿里云Centos7.0上配置java web环境)
2024年8月5日 22:10
超详细tomcat安装及配置教程(apache_tomcat_7.0.69怎样安装及配置)
2024年8月5日 04:15
vmware开100个虚拟机(我电脑要开100个虚拟机电脑需要什么样的配置)
2024年8月5日 03:25
web服务器的配置(ASP.NET开发宝典:配置Web服务器(IIS)虚拟站点)
2024年8月4日 12:35
apache一键安装(怎样在windows下配置apache vhost)
2024年8月3日 20:50
qt creator怎么配置vs2013编译器?跪求啊!STM32编译开发板串口例程,总是出现错误
2024年8月3日 20:26
cmakelist语法(怎样编写Cmake的配置文件Cmakelist.txt)
2024年8月2日 15:46
pycharm使用教程unittest(一、unittest通过main()方法运行的配置)
2024年7月27日 23:55
console线驱动(笔记本没有console口想连线配置交换机和路由怎么办)
2024年7月27日 20:25
更多文章:
oracle执行sql脚本(如何用PL/SQL在oracle下执行多个SQL脚本)
2024年7月24日 05:44
return true的意思(关于JS中return true和return false的问题)
2024年7月24日 10:19
源程序目标程序可执行程序(请问什么叫目标程序、可执行程序、源程序、伪代码程序)
2024年7月12日 22:43
assetbundle打包(如何使用AssetBundle打包并加载场景)
2024年7月15日 20:28
虚拟机和linux什么关系(linux虚拟机与linux操作系统有什么不同)
2024年7月21日 04:16
c语言数组怎么存放汉字(C语言中如何读取文件中的汉字并将其存入数组中)
2024年8月6日 08:55
printf输出格式 unsigned short(c语言无符号短整型和短整型输出符号是什么)
2024年7月18日 11:55
美国vps速度怎么样美国服务器速度怎么样美国速度最快的主机用哪个机房的?便宜又好用的美国VPS主机推荐
2024年6月28日 21:50
diphthong(谁能告诉我Diphthong和digraph的区别啊)
2024年6月30日 07:23
八爪鱼采集教程(八爪鱼如何发布到网站,有那个详细教下那个发布接口的么详细点,别让我看教程,不懂才请教的)
2024年7月3日 12:51
织梦侵权换程序有用吗(我想问一下程序高手们!我把别人的网站模版套下来用织梦CMS怎么做,安全性怎么样)
2024年6月24日 02:00