当前位置：主页 > 查看内容

Spark SQL CLI部署CentOS分布式集群Hadoop上方法

发布时间：2021-06-29 00:00| 有位朋友查看

简介：? 前言配置的虚拟机为Centos6.7系统hadoop版本为2.6.0版本先前已经完成搭建 CentOS部署Hbase 、 CentOS6.7搭建Zookeeper 和编写MapReduce前置插件Hadoop-Eclipse-Plugin 安装。在此基础上完成了 Hive详解以及CentOS下部署Hive和Mysql 和 Spark框架在CentO……

前言

配置的虚拟机为Centos6.7系统，hadoop版本为2.6.0版本，先前已经完成搭建CentOS部署Hbase、CentOS6.7搭建Zookeeper和编写MapReduce前置插件Hadoop-Eclipse-Plugin 安装。在此基础上完成了Hive详解以及CentOS下部署Hive和Mysql和Spark框架在CentOS下部署搭建。现在进行Spark的组件Spark SQL的部署。

对于Spark SQL的详细介绍可以在Spark框架深度理解二：生态圈中参阅。

首先我所部署的集群配置为

CentOS-6.7

Spark-2.4.7

Hive-2.3.7

若有版本不兼容的问题可参考其他版本的部署。

若要使用Spark SQL CLI的方式访问操作Hive表数据，需要对Spark SQL进行如下所示的环境配置，将Spark SQL 连接到一个部署好的Hive上。

当然即使没有部署好Hive，Spark SQL也是可以运行的，但是Spark SQL会在当前的工作目录中创建出自己的Hive元数据库，称为metastore_db。

现在正式进行配置。

（1）寻找自己所安装的Hive，进入到conf中：

将hive-site.xml文件复制到spark的conf目录下：

cp /usr/local/hive-2.3.7/conf/hive-site.xml /usr/local/spark2.4.7/conf

（2）现在我们需要MySQL驱动。缺少MySQL驱动可以自行在官网上下载

?wget http://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.40.tar.gz

不过既然配置过Hive想必MySQL驱动以及放在原有的Hive的lib目录下

将该驱动放入spark的jars中（spark升到2.0.0版本后lib改为了jars目录）

cp mysql-connector-java-5.1.40-bin.jar /usr/local/spark2.4.7/jars

然后在spark的spark-env.sh文件下添加一行路径

export SPARK_CLASSPATH=/usr/local/spark2.4.7/jars/mysql-connector-java-5.1.40-bin.jar

（3）启动MySQL服务

service mysqld start

（4）启动Hive的metastore服务：

（5）修改日志级别。

进入spark的conf目录：

将该目录下的log4j.properties.template文件复制为log4j.properties，修改该文件：

（6）启动Spark集群。

./start-all.sh

（7）启动spark-sql。进入spark的bin目录下：

测试完后验证部署成功。

；原文链接：https://blog.csdn.net/master_hunter/article/details/115677849
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：使用QQ推广作为客服或留言 下一篇：没有了

随机推荐

浅谈从ASP.NET Core2.2到3.0你可能会遇到

趁着假期的时间所以想重新学习下微软的官方文档来巩固下基础知识。我们都知道微...
如何在Flash中处理Cookies？

testCookies.asp ' 检查浏览器是否接受 Cookies. % strTest = Request.QueryStri...
列举ASP.NET页面之间传递值的几种方式

1 .列举ASP.NET 页面之间传递值的几种方式。 1).使用QueryString, 如....id=1; r...
[设计模式C++]工厂模式

????工厂模式主要是为创建对象提供过渡接口以便将创建对象的具体过程屏蔽隔离起...
运维：生产日志重复打印了，赶紧来看看~

一、前言在一次生产环境发布后，运维对我说，你这个日志打印了两遍，你看一下，...
c语言

c语言 Float的存储方式 ?浮点型存储方式是根据IEEE电子和电子协会 754规定的-1)^...
JSP中springmvc配置validator的注意事项

SpringMVC介绍之Validation 对于任何一个应用而言在客户端做的数据有效性验证都...
AJAX应用实例之检测用户名是否唯一(实例

先给大家展示下效果图，然后再给大家撸代码，效果图如下所示：下面写一个简单的...
时间与日期——瞬时（Instant）

JAVA中的时间与日期——瞬时Instant 瞬时Instant Instant时间线上的一个瞬时点。...
Runnable.com 在线测试代码片分享网站

代码片段是开发者每天都要面对的东西，甚至有时候查找代码片段的时间比编写新代...

Spark SQL CLI部署CentOS分布式集群Hadoop上方法

前言

推荐图文

关注程序员健康：程序最需要注意的几件事

BOE（京东方）柔性屏显示技术发展势头强劲，赋能应

2021-4-3课程——SQL Server查询【2】

面试官上来就问MySQL事务，瑟瑟发抖...

如何通过PHP实现Des加密算法代码实例

讲解 Zookeeper 的五个核心知识点

随机推荐

浅谈从ASP.NET Core2.2到3.0你可能会遇到

如何在Flash中处理Cookies？

列举ASP.NET页面之间传递值的几种方式

[设计模式C++]工厂模式

运维：生产日志重复打印了，赶紧来看看~

c语言

JSP中springmvc配置validator的注意事项

AJAX应用实例之检测用户名是否唯一(实例

时间与日期——瞬时（Instant）

Runnable.com 在线测试代码片分享网站

关于我们