虚拟机上安装Hadoop(单机配置)

本文详细介绍了在虚拟机上安装Hadoop 3.3.3并进行单节点配置的步骤,包括修改core-site.xml、hadoop-env.sh、hdfs-site.xml、mapred-site.xml等配置文件,以及初始化NameNode、启动服务、验证集群等操作。

作者:zhuge···预计阅读 11 分钟·648 阅读·0 评论
虚拟机上安装Hadoop(单机配置)

准备工作 请稳步---> 虚拟机上安装Hadoop(上)

单节点配置开始

到/opt/hadoop-3.3.3/etc/hadoop下修改xml文件信息

1)修改 core-site.xml

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/data/hadoop/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.default.name</name>
        <value>hdfs://0.0.0.0:9000</value>
    </property>
</configuration>

2)修改 hadoop-env.sh

执行命令  

vi hadoop-env.sh,将${JAVA_HOME} 修改为自己的JDK路径
export JAVA_HOME=/opt/jdk1.8.0_333

3)修改 hdfs-site.xml

<configuration>
    <property>
        <name>dfs.name.dir</name>
        <value>/data/hadoop/dfs/name</value>
        <description>Path on the local filesystem where theNameNode stores the namespace and transactions logs persistently.</description>
    </property>
    <property>
        <name>dfs.data.dir</name>
        <value>/data/hadoop/dfs/data</value>
        <description>Comma separated list of paths on the localfilesystem of a DataNode where it should store its blocks.</description>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.permissions</name>
        <value>false</value>
        <description>need not permissions</description>
    </property>
</configuration>

4)修改 mapred-site.xml

<configuration>
    <property>
        <name>mapred.job.tracker</name>
        <value>localhaost:9001</value>
    </property>
    <property>
        <name>mapred.local.dir</name>
        <value>/data/hadoop/var</value>
    </property>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

5)到此处Hadoop的单机模式配置就完成了

6)启动验证服务

#执行命令 初始化hadoop 

cd /opt/hadoop-3.3.3/bin
./hadoop namenode -format
#修改 ./sbin/start-dfs.sh 在前面添加如下代码
HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
#修改 ./sbin/start-yarn.sh 在前面添加如下代码
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

    

#启动服务

./sbin/start-all

#出现错误,如果是权限问题需要核查是否已生成公私钥

#执行命令jps查看目前启动的进程

#网页验证服务是否清单

http://localhost:8088/cluster

http://localhost:9870/

相关文章

评论

加载中...