当前位置：主页 > 查看内容

Scheduled SQL： SLS 大规模日志上的全局分析与调度

发布时间：2021-06-01 00:00| 有位朋友查看

简介：大规模日志全局分析的需求数据大规模与时效性基于时间的数据日志、指标在日积月累后的数量是惊人的。以 SLB 七层访问日志为例每一个HTTP/HTTPS 访问请求会记录一条 access log 假设每天产生1000万条数据则一年为36亿条数据。一方面长时间的数据存储需……

大规模日志全局分析的需求数据大规模与时效性

基于时间的数据日志、指标在日积月累后的数量是惊人的。以 SLB 七层访问日志为例每一个HTTP/HTTPS 访问请求会记录一条 access log 假设每天产生1000万条数据则一年为36亿条数据。一方面长时间的数据存储需要巨大的存储空间而通过减少存储周期的方式降低存储空间虽然控制了存储成本但也丢失了有价值的历史数据。另一方面大量的数据将造成分析上的性能压力。

大部分时序数据具有时效性特征。历史数据可以接受分钟或小时级别的精度而新产生的数据需要更高的精度例如监控、线上问题调查。数据运营、分析师需要存储全量的数据以备分析历史数据直接 TTL 删除是可能最差的选择。

例如 Elasticsearch rollup、时序数据库的降精度用于解决这部分问题。

一份数据在多种场景使用

对于同一份日志可能被多种用户角色在多种场景下使用到

实时的数据需要支持关键词告警、时序数据 ML 巡检、日志上下文查询。
亚秒级延迟粒度上有全文关键词的查询、交互式 SQL 统计分析的需求。
以天为单位需要对日志做运营分析计算转化率、设计运营策略。
一周前的产生的数据大部分时候不再会被触碰到在支持偶尔的历史指标查看以外审计场景下对全量日志的存储也是必须项。

一份数据多处使用既要满足业务需求成本也是需要关心的。

自定义业务分析

云上日志设施面对的客户群呈现多样化自定义的业务需求举例如下

电商计算七日留存率业务访问 SQL 审计日志对用户信息脱敏等等。
在线教育多平台终端 android、ios、PC 埋点数据的规整直播课堂生命周期内的异常诊断等等。
游戏按游戏的数据分发存储全文搜索支持工单调查等等。

阿里云 SLS 是云原生观测分析平台为Log/Metric/Trace等数据提供大规模、低成本、实时平台化服务一站式提供数据采集、加工、分析、告警可视化与投递功能。我们将以业务为目标的数据处理归纳为两类需求

ETL 将非结构化的日志做预处理为日志信息添加业务字段数据脱敏与分发等。
分析全局数据大表上的查询和 SQL 分析支持布尔搜索、window、aggregate 操作等。
SLS 上的典型分析方案

对于 ETL、分析这两类计算任务除了交互式分析以外还需要常驻作业模式来处理结果落盘。

根据不同的业务需求这里总结了几种常见的 SLS 数据分析方案。

数仓 T 1

对于结果实时性不敏感的业务有较多采用数仓方案

数据通过 SLS 实时入库集中化存储。
全托管数据投递到 MaxCompute。
业务规划小时级或天级的计算任务生成下游表产出业务报表等结果。
流计算

以 Flink、Spark Streaming continuous mode 、Kafka Streams 为代表的实时计算系统在数据处理语义 exactly-once 、计算结果修正上的能力强大。该方案会用到 SLS 百 ms 秒级端到端延迟的 pub/sub 能力

数据实时推送到 SLS 日志库。
启动流计算任务从多个 shard 实时消费数据。
流计算任务根据算子组合情况 stateless、statefull、groupby 等切分多个拓扑执行可能涉及到数据 shuffle、watermark、state store 等机制。

这个方案在算子丰富度、实时能力、性能上综合表现全面是一把牛刀例如在电商实时大屏场景上是非常好的选择。

如果抱着挑刺的眼光来看

计算引擎层面做得均衡但缺乏存储层的优化。例如一个 logstore 上运行 10 个流计算作业无论实际需要纳入计算范围的数据有多少最终需要 10 遍全部数据流量的订阅从业务角度上看存在网络、计算资源上的浪费。
对于日志用户来说在参数配置、性能调优、问题 Debug 有复杂性复杂常常是通用、强大的另一面。在复杂场景下 DevOps-er 理解业务需求后需要设置好高级参数、选择好 state store 等。
计算集群部署方式尤其对于自建集群、数据稀疏的应用其成本上有影响例如 JobManager/TaskManager 等角色资源需要摊销。
自建程序做流式消费

还是围绕 SLS 的 pub/sub 能力以 SLS SDK 方式调用 PullData API 例如

通过 Logstash/Flume 等开源软件加载 SLS source connector。
通过函数计算 SLS 提供 FC 触发器好处是 Serverless 的 runtime 极致弹性计费。
通过 SLS 的 consumer group library 处理数据自动负载均衡、failover。

以上对于行处理场景是适用的适用面上则需要关注

该方案在绝大部分情况下都不涉及全局计算窗口、聚集即使能实现也很复杂。
自建程序、开源软件需要运维人力以及固定机器投入的成本。
自建程序做查询、分析

在 SLS 的流式存储之上开启了索引分析功能带来了全文索引、列式下推、SQL 计算能力加持。

该方案调用 SLS GetLogs API 部署一个常驻程序设置定时触发器周期调度任务执行

调用 API 读取 SLS 索引并计算数据。
读取计算结果写出到目标做存储。

用户除了需要运维程序还需要考虑以下需求

SQL 运行可能因计算量巨大而超时失败时需调度层的重试支持。
执行延迟时告警支持。
调度元信息 schedule_time 等持久化。
web console 管理的需求。
如何将 SQL 计算结果 exactly-once 入库。

本文后续重点介绍的 Scheduled SQL 从本质上来讲是对该方案的服务化对以上问题有更全面的考虑。

SLS 告警

对你没看错。有少数用户用 SLS 告警曲线救国图的是一个全托管、免运维。

SLS 告警功能支持设置定时策略执行多个 SQL 获取结果并将结果编排后发送到内置 logstore internal-alert-history 或自定义的网关/webhook。

需要说明的是告警的主要设计场景是面向小的计算结果按触发策略、值班表将事件传达给接收者。对于严苛的业务不推荐这种做法可以关注 Scheduled SQL 功能做迁移

告警的结果写出可能出现写出数据大小截断 1 MB 内、 exactly-once 等问题。
告警 1.0 是串行调度某一次计算发生延迟后多次执行实例的 SQL 时间窗口会出现空洞。
SLS 原生数据处理方案

用一张图描述 SLS 原生数据处理功能如下接下来分别按存储模型展开介绍

stream 模型

例如通过 Flink、自建消费组程序进行 SLS 数据分析都基于 stream 模型。这是 SLS 最基础的存储形式也称 LogHub 可以理解为 append-only 的 log 结构通过多个 shard 组合实现 IO 和存储的水平扩展。

LogHub 与开源软件 Kafka 是类似的功能形态 SLS 底层是共享分布式存储盘古这避免了 Kafka 在机器磁盘空间 re-balance、机器替换、存储规模的一些缺陷。

stream 存储模型在机器数据场景下有多重优势

写入模型简单不需要 commit 机制天生支持流式写入客户端移动端设备、Agent 友好。
append-only 保证了写入吞吐的设计上限满足业务高并发、高吞吐需求。
FIFO 的 changelog 模式满足大多数日志、指标类数据的生成与使用场景。

针对流式数据 ETL 场景 SLS 支持数据加工功能可以实现按量付费、全托管的行处理需求本文不多介绍可以参考SLS 数据加工的设计与实践。

table 模型

当 stream 数据写入后对于 shard 内的数据可以同时构建一份包括倒排、列存、bitmap 等信息的索引数据。shard 内 stream 数据相当于是正文索引到今天有两种形式

Logstore (with index) 适用于日志模型形式上是表结构一条数据由多组 key-value pair 组成。
Metricstore 对于指标类型数据有针对性优化有序排列存储支持快速指标计算高压缩率低存储成本。

例如 Logstore 在计算时称为 append-only Table 模型。在 SLS 场景下有以下优势

计算效率高时间一级索引过滤、计算下推都可以直接利用 index 进行节省网络、计算的性能开销与计算成本。当然 index 会有构建费用 SLS 的一份 index 数据可以服务于多个业务场景告警、仪表盘、全文搜索、监控来摊销成本。
OLAP 解决确定性问题按照条件过滤取到数据后直接进行计算即可不需要考虑流计算中 watermark、trigger 与 window 配合、state store 数据膨胀特定场景等复杂问题。
Scheduled SQL 让 SQL 可调度

SLS 的每一次 SQL 计算针对预定的一片数据做处理因此对全部时间区间从现在开始一直到未来数据的 SQL 分析依赖于上层调度也就是将要介绍的新功能 Scheduled SQL 它支持标准SQL、SLS 查询和分析语句按照调度规则周期性执行并将运行结果写入到目标库中。可用于以下场景

定时分析数据根据业务需求设置分析语句定时执行并将分析结果存储到目标库中。
全局聚合对全量、细粒度的数据进行聚合存储汇总为存储大小、精度适合的数据相当于一定程度的有损压缩数据。例如按照秒级别对 36 亿条数据进行聚合存储存储结果为 3150 万条数据存储大小为全量数据的0.875%。
投影与过滤对原始数据的字段进行筛选按照一定条件过滤数据并存储到目标Logstore中。该功能还可以通过数据加工实现数据加工的DSL语法比SQL语法具备更强的ETL表达能力更多信息请参见加工原理。

Scheduled SQL 相比于自建程序调用 SLS API 而言有以下优势

SQL 运行 timeout 提升至 600 秒单次最大处理百亿级数据。
计算资源池可选免费 project 级 15 并发、付费弹性扩展参考SQL 独享实例。
最小 1 分钟周期执行支持常驻或固定时间区间内调度运行。
支持灵活的查询时间窗口参数配置满足多样化需求。
exactly-once 写入目标库。
完善的作业实例查看、重试支持控制台、API 。
全托管运行自动处理多种异常调度不收费。
实例执行失败集成 SLS 告警通知。
Scheduled SQL 功能介绍工作机制

Scheduled SQL 涉及以下几个重要概念

作业一个 Scheduled SQL 任务对应一个作业包括调度策略、计算规则等信息。
实例一个 Scheduled SQL 作业按照调度配置按时生成执行实例。每一个实例对原始数据进行 SQL 计算并将计算结果写入目标库。实例ID 是其唯一标识。
创建时间实例的创建时间。一般是按照您配置的调度规则生成在补运行或追赶延迟时会立即生成实例。
调度时间由调度规则生成不会受到上一个实例执行超时、延迟、补运行等情况的影响。大部分场景下连续生成的实例的调度时间是连续的可处理完整的数据集。

流计算里有大量篇幅用于处理数据计算的一致性、完整性问题 Scheduled SQL 则是一种以 small-batch 模拟常驻计算的方案针对这两个问题的设计是

计算一致性SQL 每次执行会对应到确定的时间窗口由此得到确定数据集再调度 SQL 计算。Scheduled SQL 实例运行时 SQL 查询的时间窗口是基于调度时间渲染得到左闭右开格式与实例的创建时间、执行时间无关。例如调度时间为2021/01/01 10:00:00 SQL时间窗口的表达式为[ m - 10m, m) 则实际的SQL时间窗口为[2021/01/01 09:50:00, 2021/01/01 10:00:00)。
SQL 计算的结果在插入目标时需要考虑数据重复可能带来的业务影响。对于 append 模式写例如 Scheduled SQL 结果写 Logstore 写入客户端与 SLS 服务端实现了 exactly-once 协议。对于 overwrite 模式写更容易做到原子性未来会规划 Scheduled SQL 写数据库的支持。
数据的完整性作业上设置延迟执行参数从业务上给与指导在实例的调度时间点上往后延迟 N 秒才真正开始触发实例运行而实例查询的时间范围不受延迟参数影响。例如设置调度间隔为每小时、延迟执行为30秒那么一天生成24个实例其中某实例的调度时间为2021/4/6 12:00:00 执行时间为2021/4/6 12:00:30。这个设计在大部分场景下可以解决数据迟到问题但对于写 logstore 存储数据写入后将无法更新来说完全避免延迟问题是难以实现的。极端情况下数据迟到问题可通过事后的实例重试来补结果。
将 SQL 查询的时间窗口按分钟对齐例如整分钟以保证在 SLS 索引模型优化 batch log-group 组成倒排 doc 时依然能保证绝对的计算准确。
调度场景

Scheduled SQL 作业依次调度多个实例执行无论是正常被调度还是被动异常实例重试的情况同时只有一个实例处于运行中不存在多个实例并发执行的情况。

在 SLS 数据场景下主要的几种调度场景如下

场景一实例延迟执行

无论实例是否延迟执行实例的调度时间都是根据调度规则预先生成的。虽然前面的实例发生延迟时可能导致后面的实例也延迟执行但通过追赶执行进度可逐渐减少延迟直到恢复准时运行。

场景二从某个历史时间点开始执行Scheduled SQL作业

在当前时间点创建Scheduled SQL作业后按照调度规则对历史数据进行处理从调度的开始时间创建补运行的实例补运行的实例依次执行直到追上数据处理进度后再按照预定计划执行新实例。

场景三固定时间内执行Scheduled SQL作业

如果需要对指定时间段的日志做调度则可设置调度的时间范围。如果设置了调度的结束时间则最后一个实例调度时间小于调度结束时间执行完成后不再产生新的实例。

场景四修改调度配置对生成实例的影响

修改调度配置后下一个实例按照新配置生成。一般建议同步修改SQL时间窗口、调度频率等配置使得实例之间的SQL时间范围可以连续。

场景五重试失败的实例

正常情况下一个Scheduled SQL作业按照调度时间的递增顺序生成执行实例。如果实例执行失败例如权限不足、源库不存在、目标库不存在、SQL语法不合法系统支持自动重试当重试次数超过您配置的最大重试次数或重试时间超过您配置的最大运行时间时重试结束该实例状态被置为失败然后系统继续执行下一个实例。

您可以对失败的实例设置告警通知并进行手动重试。您可以对最近7天内创建的实例进行查看、重试操作。调度执行完成后系统会根据实际执行情况变更实例状态为成功或失败。

Scheduled SQL 在访问日志上的应用场景需求

在阿里云上 SLB/OSS 的被用到很多的基础计算、存储服务。在使用过程中如果要得到细粒度可观察性都绕不过访问日志在深度使用后您可能会有体感

访问日志与 request 数一比一关系数据量很大造成存储成本增加并拖慢计算。
访问日志有时效性近 15 天日志需要交互式查询分析支持历史数据需要具备降精度的指标查询能力。
访问日志有留存的需求需要长期存储以备审计。
整体方案

以 SLB 七层访问日志为例这里介绍一种实践

基于 Scheduled SQL 功能将历史原文数据压缩为低精度数据支持长期的索引存储并大大提升分析效率。
根据业务需要原文数据支持全局搜索和无损的 SQL 分析可以设置存储周期为 15天。
历史数据原文投递到 OSS 支持极低成本存储低频的审计捞数据操作也是方便的。

整体方案图如下

OSS投递操作步骤参考将日志服务数据投递到OSS。

Scheduled SQL 配置使用增强型资源池默认 STS 角色授权最终计算结果写同区域 Logstore

使用Scheduled SQL时建议根据业务情况同时兼顾数据实时性和准确性。

考虑数据上传日志服务存在延迟情况您可以结合数据采集延迟以及业务能够容忍的最大结果可见延迟设置执行延迟和SQL时间窗口结束时间往前一点避免实例执行时SQL时间窗口内的数据未全部到达。
建议SQL时间窗口按分钟对齐例如整分钟、整小时以保证上传局部乱序数据时的数据准确度。

在这里每分钟调度一次 SQL 计算最近一分钟窗口的数据并设置延迟执行如果对于实时性要求不高建议这个值设置大一些

Scheduled SQL 写出到目标 Logstore 数据的结果如下图其中 tag 字段是系统默认添加的信息用于数据的搠源。

Scheduled SQL 调度生成的实例信息在任务管理页面可以查看对于失败的任务可以做重试。

方案效果功能体验上热、温数据存储、分析支持交互式查询、分析的能力保留了灵活性。
冷数据分析支持分钟粒度的自定义指标查询例如本文是 host、method、status 维度统计可以快速实现问题分析同样查询范围延迟降低两个数量级。
冷数据存储以压缩格式投递到 OSS 存储保留了审计能力。
存储成本上在永久存储的背景下存储量降低到之前的 1/1000 OSS 上的压缩格式存储且做到极低的单价。

注目前 Scheduled SQL 已发布部分区域参考快速开始使用 Scheduled SQL 其它区域正在逐个开放中如有问题或需求可以工单或钉钉群联系 SLS 团队。

本文转自网络，原文链接：https://developer.aliyun.com/article/784421
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：蚂蚁自研数据库 OceanBase 首次阐述战略：继续坚持自研开放之路 下一篇：没有了

随机推荐

制作自己想要的地图

我们平时使用地图的时候要么到高德或者百度等开发平台去使用，要么去可视化站点...
添加标签_裸金属服务器 BMS_用户指南_资

标签用于标记云资源，如实例、镜像和磁盘等。如果您的帐户下有多种云资源，并且...
玩转Kubeflow第一章: kubeflow 国内本地

引言 kubeflow 是 google 开源的一个基于 kubernetes 的 ML workflow 平台，其集...
配置安全组规则_云耀云服务器 HECS_用户

操作场景安全组类似防火墙功能，是一个逻辑上的分组，用于设置网络访问控制。用...
想在Kaggle比赛中进入前4%，你需要掌握哪

本文转载自公众号读芯术(ID：AI_Discovery)。如果你一直关注Kaggle新闻，那对Me...
搞笑说说大全：当年我也是颗痴情种子，结

1．一旦我发现数学有题目不会做了我就跳过，这一跳我发现根本停不下来。 2．慢点...
我对Rust 的第一印象

大家好，我是站长 polarisxu。有些朋友应该知道，我最近在看 Rust，在朋友圈我...
看完这个“秒杀”设计方案！我有点慌了

图片来自 Pexels 前者对性能有极高的要求，而后者又正好拉低了性能，本文谈谈秒...
泛微实现云上自动化部署

本文介绍了阿里云资源编排服务ROS如何帮助OA实现自动化部署，大大提升效率。公...
.ca到.com，终端启用大六位收购的3字母域

互联网时代，如果没有很好地对品牌进行塑造、宣传、推广，几乎可以说是寸步难行...

Scheduled SQL： SLS 大规模日志上的全局分析与调度

推荐图文

kafka消费组信息采集异常(hang住)排查

彻底掌握分布式事务2PC、3PC模型

轻松教你搞定组件的拖拽, 缩放, 多控制点伸缩和拖拽

浅谈云计算的概念和体系架构

聊聊Java中的转发与重定向

TigerGraph完成图数据库史上最大单笔过亿美元融资，

随机推荐

制作自己想要的地图

添加标签_裸金属服务器 BMS_用户指南_资

玩转Kubeflow第一章: kubeflow 国内本地

配置安全组规则_云耀云服务器 HECS_用户

想在Kaggle比赛中进入前4%，你需要掌握哪

搞笑说说大全：当年我也是颗痴情种子，结

我对Rust 的第一印象

看完这个“秒杀”设计方案！我有点慌了

泛微实现云上自动化部署

.ca到.com，终端启用大六位收购的3字母域

关于我们