当前位置：主页 > 查看内容

MaxCompute Spark 资源使用优化祥解

发布时间：2021-07-15 00:00| 有位朋友查看

简介：本文作者吴数傑阿里云智能开发工程师 1. 概述本文主要讲解MaxCompute Spark资源调优目的在于在保证Spark任务正常运行的前提下指导用户更好地对Spark作业资源使用进行优化极大化利用资源降低成本。 2. SensorSensor提供了一种可视化的方式监控运行中……

本文作者吴数傑阿里云智能开发工程师

1. 概述

本文主要讲解MaxCompute Spark资源调优目的在于在保证Spark任务正常运行的前提下指导用户更好地对Spark作业资源使用进行优化极大化利用资源降低成本。

2. SensorSensor提供了一种可视化的方式监控运行中的Spark进程每个worker Executor 及master Driver 都具有各自的状态监控图可以通过Logview中找到入口如下图所示

打开Sensor之后可以看到下图提供了Driver/Executor在其生命周期内的CPU和内存的使用情况 cpu_plan/mem_plan 蓝线代表了用户申请的CPU和内存计划量用户可以直观地从cpu_usage图中看出任务运行中的CPU利用率mem_usage代表了任务运行中的内存使用是mem_rss和page cache两项之和详见下文

Memory Metricsmem_rss 代表了进程所占用了常驻内存这部分内存也就是Spark任务运行所使用的实际内存通常需要用户关注如果该内存超过用户申请的内存量就可能会发生OOM 导致Driver/Executor进程终止。此外该曲线也可以用于指导用户进行内存优化如果实际使用量远远小于用户申请量则可以减少内存申请极大化利用资源降低成本。mem_cache page_cache 用于将磁盘中的数据缓存到内存中从而减少磁盘I/O操作通常由系统进行管理如果物理机内存充足那么mem_cache可能会使用很多用户可以不必关心该内存的分配和回收。

3. 资源参数调优 1 Executor Cores相关参数 spark.executor.cores每个Executor的核数即每个Executor中的可同时运行的task数目Spark任务的最大并行度是num-executors * executor-coresSpark任务执行的时候一个CPU core同一时间最多只能执行一个Task。如果CPU core数量比较充足通常来说可以比较快速和高效地执行完这些Task。同时也要注意每个Executor的内存是多个Task共享的如果单个Executor核数太多内存过少那么也很可能发生OOM。 2 Executor Num相关参数 spark.executor.instances该参数用于设置Spark作业总共要用多少个Executor进程来执行通常用户可以根据任务复杂度来决定到底需要申请多少个Executor此外需要注意如果出现Executor磁盘空间不足或者部分Executor OOM的问题可以通过减少单个Executor的cores数增加Executor的instances数量来保证任务总体并行度不变同时降低任务失败的风险。 3 Executor Memory相关参数 spark.executor.memory该参数用于设置每个Executor进程的内存。Executor内存的大小很多时候直接决定了Spark作业的性能而且JVM OOM在Executor中更为常见。

相关参数2 spark.executor.memoryOverhead设置申请Executor的堆外内存主要用于JVM自身字符串, NIO Buffer等开销注意memoryOverhead 这部分内存并不是用来进行计算的用户代码及spark都无法直接操作。如果不设置该值那么默认为spark.executor.memory * 0.10 最小为384 MBExecutor 内存不足的表现形式在Executor的日志 Logview- 某个Worker- StdErr 中出现Cannot allocate memory

在任务结束的Logview result的第一行中出现 The job has been killed by OOM Killer , please check your job s memory usage.在Sensor中发现内存使用率非常高在Executor的日志中出现java.lang.OutOfMemoryError: Java heap space在Executor的日志中出现GC overhead limit exceededSpark UI中发现频繁的GC信息可能出现OOM的间接表现形式部分Executor出现No route to host: workerd********* / Could not find CoarseGrainedScheduler等错误可能原因及解决方案限制executor 并行度将cores 调小多个同时运行的 Task 会共享一个Executor 的内存使得单个 Task 可使用的内存减少调小并行度能缓解内存压力增加单个Executor内存增加分区数量减少每个executor负载考虑数据倾斜问题因为数据倾斜导致某个 task 内存不足其它 task 内存足够如果出现了上文所述的Cannot allocate memory或The job has been killed by OOM Killer , please check your job s memory usage 这种情况通常是由于系统内存不足可以适当增加一些堆外内存来缓解内存压力通常设置spark.executor.memoryOverhead为1g/2g就足够了 4 Driver Cores相关参数spark.driver.cores通常Driver Cores不需要太大但是如果任务较为复杂如Stage及Task数量过多或者Executor数量过多 Driver需要与每个Executor通信并保持心跳在Sensor中看到Cpu利用率非常高那么可能需要适当调大Driver Cores另外要注意在Yarn-Cluster模式运行Spark任务不能直接在代码中设置Driver的资源配置 core/memory 因为在JVM启动时就需要该参数因此需要通过--driver-memory命令行选项或在spark-defaults.conf文件/Dataworks配置项中进行设置。 5 Driver Memory相关参数1 spark.driver.memory设置申请Driver的堆内内存与executor类似相关参数2 spark.driver.maxResultSize代表每个Spark的action 例如collect 的结果总大小的限制默认为1g。如果总大小超过此限制作业将被中止如果该值较高可能会导致Driver发生OOM 因此用户需要根据作业实际情况设置适当值。相关参数3 spark.driver.memoryOverhead设置申请Driver的堆外内存与executor类似

Driver的内存通常不需要太大如果Driver出现内存不足通常是由于Driver收集了过多的数据如果需要使用collect算子将RDD的数据全部拉取到Driver上进行处理那么必须确保Driver的内存足够大。表现形式 Spark应用程序无响应或者直接停止在Driver的日志 Logview- Master- StdErr 中发现了Driver OutOfMemory的错误Spark UI中发现频繁的GC信息在Sensor中发现内存使用率非常高在Driver的日志中出现Cannot allocate memory可能原因及解决方案代码可能使用了collect操作将过大的数据集收集到Driver节点在代码创建了过大的数组或者加载过大的数据集到Driver进程汇总SparkContext DAGScheduler都是运行在Driver端的。对应rdd的Stage切分也是在Driver端运行如果用户自己写的程序有过多的步骤切分出过多的Stage 这部分信息消耗的是Driver的内存这个时候就需要调大Driver的内存。有时候如果stage过多 Driver端甚至会有栈溢出 6 本地磁盘空间相关参数 spark.hadoop.odps.cupid.disk.driver.device_size 该参数代表为单个Driver或Executor申请的磁盘空间大小默认值为20g 最大支持100gShuffle数据以及BlockManager溢出的数据均存储在磁盘上磁盘空间不足的表现形式在Executor/Driver的日志中发现了No space left on device错误解决方案最简单的方法是直接增加更多的磁盘空间调大spark.hadoop.odps.cupid.disk.driver.device_size如果增加到100g之后依然出现该错误可能是由于存在数据倾斜 shuffle或者cache过程中数据集中分布在某些block 也可能是单个Executor的shuffle数据量确实过大可以尝试对数据重分区解决数据倾斜问题缩小单个Executor的任务并发spark.executor.cores缩小读表并发spark.hadoop.odps.input.split.size增加executor的数量spark.executor.instances需要注意同样由于在JVM启动前就需要挂载磁盘因此该参数必须配置在spark-defaults.conf文件或者dataworks的配置项中不能配置在用户代码中此外需要注意该参数的单位为g 不能省略g很多时候由于用户配置位置有误或者没有带单位g 导致参数实际并没有生效任务运行依然失败
4. 总结

上文主要介绍了MaxCompute Spark在使用过程中可能遇到的资源不足的问题及相应的解决思路为了能够最大化利用资源首先建议按照1: 4的比例来申请单个worker资源即1 core: 4 gb memory 如果出现OOM 那么需要查看日志及Sensor对问题进行初步定位再进行相应的优化和资源调整。不建议单个Executor Cores 设置过多通常单个Executor在2-8 core是相对安全的如果超过8 那么建议增加instance数量。适当增加堆外内存为系统预留一些内存资源也是一个常用的调优方法通常在实践中可以解决很多OOM的问题。最后用户可以参考官方文档https://spark.apache.org/docs/2.4.5/tuning.html 包含更多的内存调优技巧如gc优化数据序列化等。

5.MaxCompute Spark 相关文章

MaxCompute Spark 使用和常见问题

Spark On MaxCompute如何访问Phonix数据

如何使用MaxCompute Spark读写阿里云Hbase

Spark在MaxCompute的运行方式

Maxcompute Spark作业管控利器—Cupid Console

MaxCompute Spark与Spark SQL对比分析及使用注意事项

更多关于大数据计算、云数仓技术交流欢迎扫码加入 “MaxCompute开发者社区” 钉钉群

2群.jpg

本文转自网络，原文链接：https://developer.aliyun.com/article/785341
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：2021中国互联网大会正式发布阿里云《云采用框架白皮书》 下一篇：王炸结营！实时计算 Flink 版 + Hologres，《实时数仓入门训练营

随机推荐

数据为先，“1+N”模式推动智慧教育创新

信息化2.0时代提出开展智慧教育创新发展行动。2019年2月，中共中央、国务院印发...
步骤一：基础配置_弹性云服务器 ECS_快速

前提条件请您在购买前确保已完成注册和充值。详细操作请参见如何注册公有云管...
就凭这3点，可以完全理解Python的类方法

在Python语言中有如下3种方法：成员方法类方法(classmethod) 静态方法(staticm...
Docker生成新镜像版本的两种方式

Docker生成新镜像版本的两种方式 There are two ways Docker can generate new m...
用于数据可视化的9款主流分析工具！

【51CTO.com快译】数据可视化工具不断发展，提供更强大的功能，同时改善可访问...
实时数仓入门训练营：Hologres 数据导入/

本文整理自直播《Hologres 数据导入/导出实践-王华峰(继儒)》视频链接: https:/...
高并发服务遇redis瓶颈引发time-wait事故

摘要元旦期间订单业务线告知推送系统无法正常收发消息，作为推送系统维护者...
星环科技TDS 为数据全生命周期管理提供一

2021年3月24日，主题为《数据的世界，世界的数据》的星环科技2021春季新品发布会...
关于 Node.js 中的异步迭代器

从 10.0.0 版开始，异步迭代器就出现在 Node 中了，在本文中，我们将讨论异步迭...
建站什么虚拟主机够用

建站什么虚拟主机够用？这要看搭建的是什么类型的网站。比如个人博客类型的网...

MaxCompute Spark 资源使用优化祥解

推荐图文

数据科学50年，数据科学家是否依然是21世纪最性感的

新疆喀什疫情｜疫情之下：大数据的洞察力

2021 的 Node.js 开发人员路线图

详解LongAdder实现原理

达摩院重要科技突破！空天数据库引擎Ganos解读

阿里云CDN/DCDN加速安全助力企业出海，原生防护延伸

随机推荐

数据为先，“1+N”模式推动智慧教育创新

步骤一：基础配置_弹性云服务器 ECS_快速

就凭这3点，可以完全理解Python的类方法

Docker生成新镜像版本的两种方式

用于数据可视化的9款主流分析工具！

实时数仓入门训练营：Hologres 数据导入/

高并发服务遇redis瓶颈引发time-wait事故

星环科技TDS 为数据全生命周期管理提供一

关于 Node.js 中的异步迭代器

建站什么虚拟主机够用

关于我们