��/��/��ţ

��

python3��hadoop��spark��װ���С��

��Դ�� - shareeyes

Python��һ�ֽ��͡��󡢶�̬��͵ĸ߼��ԡ�

Hadoop��һ��Դ��ܣ��Ⱥʹ�ü򵥱��ģ�ͼ��ķֲ�ʽ��洢��ݡ��Ŀ��Ǵӵ�һ�ķ��ǧ̨��չ��ÿһ��̨��ṩ��ؼ��ʹ洢��

Apache Spark��רΪ��ģ��ݴ��ƵĿ��ͨ�õļ��档

centos_7ϵͳ��װPython3

��ǰϵͳ�Դ�Ĭ�ϰ�װ��python�汾Ϊ2.7.5��׼��python3.x�汾��

Linux�±��밲װpython3.6.5

1��װ��뻷��yum -y groupinstall "Development tools"

2��װһЩ��Ҫ�Ŀ��ļ�

yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpcap-devel xz-devel

3��python-3.6.5 ,��ѹpython-3.6.5.tgz

4��ð�װ·��Ϊ

5) ��

make && make install

6��ӺͲ��

hadoop��װ

1: ��/��ģʽ

��Hadoop��ϵͳ�У�Ĭ��֮��ᱻ��һ��ģʽ��java��

2��ģ��ֲ�ʽģʽ

��ڵ�̨��ķֲ�ʽģ�⡣Hadoop�ػ�ÿ��̣��hdfs,yarn,MapReduce�ȣ��Ϊһ��java��С��ģʽ�Կ��ǳ��á�

3��ȫ�ֲ�ʽģʽ

��ģʽ��ȫ�ֲ�ʽ��С��̨��̨��ļ�Ⱥ��

��Ҫģ��ֲ�ʽģʽ��װHadoop

1��Hadoop��װ��

wget http://mirror.bit.edu.cn/apache/hadoop/common/stable2/hadoop-2.9.1.tar.gz

��ִ�а��Դ�롣

��ѹtar.gz�ļ��

tar -zxvf hadoop-2.9.1.tar.gz

��hadoop-2.9.1Ϊhadoop

sudo mv hadoop-2.9.1 /usr/local/hadoop

2��Hadoop

export HADOOP_HOME=/usr/local/hadoop

3��Hadoop

1��ļ� slaves��Ϊ DataNode ��д��ļ��ÿ��һ��Ĭ��Ϊ localhost��α�ֲ�ʽ��ʱ��ڵ㼴��Ϊ NameNode Ҳ��Ϊ DataNode��

2��ļ� core-site.xml ��Ϊ��ã�core-site.xml�ļ��а��/д��Hadoop��ʵ��Ķ˿ںŵ��Ϣ��ļ�ϵͳ�洢��ڴ洢��ݴ洢��ƺʹ�С��

3��ļ� hdfs-site.xml��dfs.replication һ��Ϊ 3��ֻ��һ�� Slave �ڵ㣬�� dfs.replication ��ֵ��Ϊ 1��

5, �ļ� yarn-site.xml��

4��֤Hadoop��װ

��Ĳ��֤Hadoop��װ��

1��ʽ��HDFS

�״��Ҫ�� Master �ڵ�ִ�� NameNode �ĸ�ʽ��

$ hdfs namenode -format

2��֤Hadoop��DFS

��DFS��ִ����Hadoop�ļ�ϵͳ��

$ start-dfs.sh

3��֤Yarn �ű�

��yarn�ű��ִ�д����yarn�ػ��̡�

$ start-yarn.sh

4��ֹͣ/�ر� Hadoop

$HADOOP_HOME/sbin/stop-dfs.sh

$HADOOP_HOME/sbin/stop-yarn.sh

Spark��װ

ע��װsparkǰ��Ҫ��װscala

1.��spark��װ��

wget http://mirror.bit.edu.cn/apache/spark/spark-2.3.1/spark-2.3.1-bin-hadoop2.7.tgz

��ѹ��װ��

tar -zxvf spark-2.3.1-bin-hadoop2.7.tgz

��ļ��

mv spark-2.3.1-bin-hadoop2.7 spark

2��û��

3.��Spark��

�˴��Ҫ��õ��ļ�Ϊ��spark-env.sh��slaves��

��ļ�Ŀ¼�ڰ�װĿ¼�µ�conf�£�Ȼ��Ĭ��ģ��п��Ҫ�༭��ļ��

cp conf/spark-env.sh.template conf/spark-env.sh

cp conf/slaves.template conf/slaves

1) ִ�� vim conf/slaves ��Worker��Ľڵ㣬��hadoop��slaves��ƣ��Ĭ�ϻ��߸�Ϊ��

2��ִ�� vim conf/spark-env.sh �༭spark��ؽű��ã�

��˵��

- JAVA_HOME��Java��װĿ¼

- SCALA_HOME��Scala��װĿ¼

- HADOOP_HOME��hadoop��װĿ¼

- HADOOP_CONF_DIR��hadoop��Ⱥ��ļ��Ŀ¼

- SPARK_MASTER_IP��spark��Ⱥ��Master�ڵ��ip��ַ

- SPARK_WORKER_MEMORY��ÿ��worker�ڵ��ܹ��exectors��ڴ��С

- SPARK_WORKER_CORES��ÿ��worker�ڵ��ռ�е�CPU��Ŀ

- SPARK_WORKER_INSTANCES��ÿ̨��Ͽ��worker�ڵ��Ŀ

4.��spark

[��]��

1��hadoopα�ֲ�ʽ�� ޷��datanode

��

��/tmp�µ�Hadoop��ص��ʱ�ļ�ɾ��

��/hadoop.tmp.dirĿ¼��ա�

ע��ÿ��ִ��hadoop namenode -formatʱ��ΪNameNode��namespaceID,��hadoop.tmp.dirĿ¼�µ�DataNode��Ǳ��ϴε�namespaceID��ΪnamespaceID�Ĳ�һ�£��DataNode�޷��ֻҪ��ÿ��ִ��hadoop namenode -format֮ǰ��ɾ��hadoop.tmp.dir��·��Ϊ /usr/local/hadoop/�µģ�tmpĿ¼�Ϳ��ɹ��ɾ��/usr/local/hadoop/tmp/dfs�µ�dataĿ¼��Ȼ��dfs��hadoop��װ·�� /usr/local/hadoop/ �£��./sbin/start-dfs.sh��ɡ�

2��spark-shell��

�ֲ�ʽ��㼯Ⱥ

�ֲ�ʽ��㼯Ⱥ��ṩ�� ṩ��ǿ��ֵ��ݴ��׷��ۺ��ܡ��û��ڲ��˽�ֲ�ʽ�ײ�ϸ�ڵ��£��ֲ�ʽ��򣬳��ü�Ⱥ��и��ʹ洢��

Ŀǰ��еĿ�Դ�ֲ�ʽ��ƽ̨Hadoop��Spark��һ��ֲ�ʽ ��㼯Ⱥƽ̨��ͨ��ƽ̨��û��ɵؿ��ʹ��ݡ��ƽ̨�ϣ��ֲ�ʽ��ǲ��еģ��˴��ٶȷǳ��졣ͬʱ��ڴ洢��ά��˶��ȷ��ܹ��ʧ�ܵĽڵ��½��зֲ��磬Hadoop�ķֲ�ʽ�ܹ��ɽ��ֱ�Ӵ洢��HDFS��ֲ�ʽ�ļ�ϵͳ�ϣ��Hadoop��MapReduce��ʵ��˽��飬��Ƭ��͵��ڵ��ϣ�֮��Ե��ݼ��ʽ��ص��ݲֿ��

��: 2018-08-032018-08-03 19:34:46
ԭ��https://kuaibao.qq.com/s/20180803A1O37S00?refer=cp_1026
��Ѷ��Ѷ�ƿ��Ѷ��ݿ��ƽ̨�ʺţ��ţ��֮һ��Ѷ��ݿ��ƽ̨��Э�顷ת�ط��ݡ�
��Ȩ��ϵ cloudcommunity@tencent.com ɾ��

��Ѷ

ɨ��

��վ�� Ⱥ

��ȡר�� 10Ԫ��ż�ȯ

˽�� ��ɻ�

python3��hadoop��spark��װ���С��

��Ѷ

ɨ��

��

�

��Դ

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�

python3��hadoop��spark��װ�����С��

�����Ѷ

����

�

��Դ

����

��Ѷ�ƿ�����

���Ų�Ʒ

�����Ƽ�

�����Ƽ�

python3��hadoop��spark��װ���С��

��Ѷ

��

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�