当前位置：主页 > 查看内容

Spark SQL DataFrame查看函数一文详解运用与方法

发布时间：2021-08-10 00:00| 有位朋友查看

简介：? 前言配置的虚拟机为Centos6.7系统hadoop版本为2.6.0版本先前已经完成搭建 CentOS部署Hbase 、 CentOS6.7搭建Zookeeper 和编写MapReduce前置插件Hadoop-Eclipse-Plugin 安装。在此基础上完成了 Hive详解以及CentOS下部署Hive和Mysql 和 Spark框架在CentO……

前言

配置的虚拟机为Centos6.7系统，hadoop版本为2.6.0版本，先前已经完成搭建CentOS部署Hbase、CentOS6.7搭建Zookeeper和编写MapReduce前置插件Hadoop-Eclipse-Plugin 安装。在此基础上完成了Hive详解以及CentOS下部署Hive和Mysql和Spark框架在CentOS下部署搭建。Spark的组件Spark SQL的部署：Spark SQL CLI部署CentOS分布式集群Hadoop上方法。

配置JDK1.8、Scala11.12

本文将介绍DataFrame基础操作以及实例运用

DataFrame查看数据

Spark DataFrame常用操作函数或方法

函数或方法	描述
printSchema	打印数据模式
show	查看数据
first/head/take/takeAsList	获取若干行数据
collect/collectAsList	获取所有数据

下面将：文件转化为DataFrame进行操作：

1.printSchema:打印数据模式

查看数据模式可以通过printSchema函数来查看，它会答应后出列的名称和类型。

2.show:查看数据

show相关方法

方法	介绍
show()	显示前20条记录
show(numRows:Int)	显示numRows条记录
show(truncate:Boolean)	是否最多只显示20个字符，默认为true
show(numRows:Int,truncate:Boolean)	显示numRows条记录并设置过长字符串的显示格式

show（）：

show（5）：

show（false）：

3.first/head/take/takeAsList：获取若干行记录

DataFrame获取若干行记录的方法：

方法	解释
first	获取第一行记录
head(n:Int)	获取前n行记录
take（n：Int）	获取前n行记录
takeAsList(n:Int)	获取前n行数据，并以List的形式展现

first和head功能相同，以Row或者Array[Row]的形式返回一行或多行数据。

take和takeAsList方法会将获得的数据返回到Driver端：

4.collect/collectAsList获取所有函数

collect方法可以将DataFrame中的所有数据都获取到，并返回一个Array对象，collectAsList方法可以获取所有数据到List：

；原文链接：https://blog.csdn.net/master_hunter/article/details/115840774
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：用户画像项目两大核心内容之一“one_id”（含SQL实现代码） 下一篇：BAT算法工程师的学习路线，2021最新白嫖资源！

随机推荐

ASP 常见对象总结(熟悉一下利用以后的开

ADO对象： Connection Command Recordset Record Stream ASP支持的对象很多，可...
ES6的循环与可迭代对象示例详解

本文将研究 ES6 的 for ... of 循环。旧方法在过去，有两种方法可以遍历 javas...
Android 微信文件传输助手文件夹

微信文件传输助手是微信电脑版与手机微信之间相互传输图片等文件的好工具，但很...
【排序算法】之lowb三人组（冒泡、插入、

【排序算法】之lowb三人组冒泡、插入、选择什么是lowb三人组冒泡排序bubble so...
正则表达式的应用

一、正则表达式概述二、正则表达式在VBScript中的应用三、正则表达式在VavaScr...
歌词编辑器和选择歌曲可播放的网页

歌词编辑器歌词编辑器第一步：选择要播放的歌曲并播放第二步：填写全部的歌词...
Vue中computed和watch有哪些区别

计算属性computed：支持缓存，只有依赖数据发生改变，才会重新进行计算不支持...
成也数据库败也数据库 Oracle 如何云渡

一石激起千层浪，继中国区浩浩荡荡的大裁员告一段落之后，甲骨文并未因此收起手...
vbs:把一段文字中指定字符颜色变成红色的

vbs:把一段文字中指定字符颜色变成红色的正则 functionc(Tstr,Word) Dimre Setre...
利用Typings为Visual Studio Code实现智

前言相信大家都知道在IDE中代码的智能提示几乎都是标配，虽然一些文本编辑器也...

Spark SQL DataFrame查看函数一文详解运用与方法

前言

DataFrame查看数据

Spark DataFrame常用操作函数或方法

1.printSchema:打印数据模式

2.show:查看数据

3.first/head/take/takeAsList：获取若干行记录

4.collect/collectAsList获取所有函数

推荐图文

java面试2021年高级（中、初）程序员算法、数据结构

湖南大学计科专业分流个人建议

AIOps工具，要开源还是闭源？

ESP32学习笔记（2）——GPIO接口使用

JSP实现计算器功能（网页版）

关于爬虫和反爬虫的简略方案分享

随机推荐

ASP 常见对象总结(熟悉一下利用以后的开

ES6的循环与可迭代对象示例详解

Android 微信文件传输助手文件夹

【排序算法】之lowb三人组（冒泡、插入、

正则表达式的应用

歌词编辑器和选择歌曲可播放的网页

Vue中computed和watch有哪些区别

成也数据库败也数据库 Oracle 如何云渡

vbs:把一段文字中指定字符颜色变成红色的

利用Typings为Visual Studio Code实现智

关于我们