安装 - 文件存储 HDFS

环境准备

本节以hadoop-mapreduce-examples为例，介绍文件系统SDK的使用方式。其中MapReduce以伪分布式方式运行。有关MapReduce的伪分布方式，请参见Apache Hadoop文档说明。

运行java -version命令，查看JDK版本。

JDK版本不能低于1.8。
按照以下方式设置环境变量，假设安装位置为/opt/install/java。
```
JAVA_HOME=/opt/install/java
PATH=/opt/install/java/bin:$PATH
```

下载 SDK

您可以下载文件存储HDFS文件系统SDK的JAR文件aliyun-sdk-dfs-x.y.z.jar。

配置 Hadoop

下载hadoop 2.7.2发布包。
运行tar -zxvf hadoop-2.7.2.tar.gz命令，解压缩下载的发布包。
运行export HADOOP_HOME=yourWorkingDir/hadoop-2.7.2命令，设置环境变量。
运行cd hadoop-2.7.2命令，进入Hadoop目录。
修改etc/hadoop/hadoop-env.sh文件，并增加环境准备中设置的JAVA_HOME。
```
# set to the root of your Java installation
export JAVA_HOME=youJAVADirt
```

修改etc/hadoop/core-site.xml文件，core-site.xml文件中需要修改的内容如下所示。

<property>
<name>fs.defaultFS</name>
<value>dfs://DfsMountpointDomainName:10290</value>
</property>
<property>
<name>fs.dfs.impl</name>
<value>com.alibaba.dfs.DistributedFileSystem</value>
</property>
<property>
<name>fs.AbstractFileSystem.dfs.impl</name>
<value>com.alibaba.dfs.DFS</value>
</property>

说明

请将MountpointDomainName替换为具体文件存储HDFS实例的挂载地址，如xxx.cn-hangzhou.dfs.aliyuncs.com。
core-site.xml的内容需要同步到所有依赖hadoop-common的节点上。

部署依赖

将上述步骤中获得的aliyun-sdk-dfs-x.y.z.jar拷贝至Hadoop生态系统组件的CLASSPATH 上。推荐将其部署到hadoop-common-x.y.z.jar所在的目录内，并复制到所有Hadoop节点。对于MapReduce组件，该目录为$HADOOP_HOME/share/hadoop/hdfs。

验证安装

请执行以下步骤验证安装。

准备数据。

运行以下命令创建目录。

$HADOOP_HOME/bin/hadoop fs -mkdir -p inputDir

运行以下命令上传文件。

touch a.txt
$HADOOP_HOME/bin/hadoop fs -put a.txt inputDir/

重启yarn服务。

运行以下命令重启yarn服务。

$HADOOP_HOME/sbin/stop-yarn.sh
$HADOOP_HOME/sbin/start-yarn.sh

执行样例测试。

在$HADOOP_HOME下执行以下样例。

wordcount样例

bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount
inputDir outputDir

grep样例

bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep
inputDir/ outputDirGrep/ "the"

安装 - 文件存储 HDFS

环境准备

下载 SDK

配置 Hadoop

部署依赖

验证安装

推荐图文

安装ROS CDK - 资源编排

大数据安全挑战：如何克服它们

成立独立公司之后，蚂蚁自研数据库OceanBase落地运

什么是A记录,mx记录,cname记录

公司域名注册怎样收费

Python轻量级循环-列表推导式

随机推荐

阿里云开发者大会核心看点揭晓，开发者最

Logstore和MySQL联合查询 - 日志服务

管理JMeter测试报告_云性能测试服务 CPTS

注册.cn域名需多少钱

PaaS，会是云计算的具体表现吗？

一个文件系统最多支持同时挂载到多少台云

我是怎么学习Python的

案例解析|游戏发行商如何低成本实现精细

亚马逊云服务（AWS）云原生自研处理器

云函数步骤 2. 创建并测试 API 服务 -

关于我们