当前位置：主页 > 查看内容

RocketMQ在搜狐的创新实践

发布时间：2021-08-03 00:00| 有位朋友查看

简介：MQ使用场景及选型大多数的视频各部门中使用过的消息中间件包括有 RedisMQ、ActiveMQ、RocketMQ、Kafka 等本文将选取几个典型的业务介绍一下其使用场景及问题。 1、引入RocketMQ 最开始使用 RocketMQ 的是计数业务计数业务需要将客户端的播放量实时计算并……

MQ使用场景及选型

大多数的视频各部门中使用过的消息中间件包括有 RedisMQ、ActiveMQ、RocketMQ、Kafka 等本文将选取几个典型的业务介绍一下其使用场景及问题。

1、引入RocketMQ

最开始使用 RocketMQ 的是计数业务计数业务需要将客户端的播放量实时计算并展示。当时采用 Redis 进行实时计数再异步调用数据库进行计数。起初这种模式没什么问题但是随着业务量变大数据库压力也进一步增大。甚至有时候数据库机器的 CPU 快被打满了另外当数据库迁移时需要暂停写入计数将面临数据丢失。

这时计数业务迫切需要一个可靠的能实时消费且能够堆积的 MQ 来改变这种状况.

当时我们考虑了 RocketMQ 和 Kafka 却最终选择了 RocketMQ 原因请参考下方。

2、放弃 Kafka

放弃 Kafka 投放业务需要将为用户推荐的内容投放到各个区域但是推荐业务需要知道用户对于推荐内容的反馈所以投放业务选择了使用 Kafka 来跟推荐业务交互。但是由于某次机器故障导致 Kafka 集群发生故障转移而不幸的是这个集群的分区数过多导致转移耗时几分钟才完成。

进而导致业务线程阻塞服务进入无响应状态。而之后了解到 RocketMQ 即使某个 broker 宕机消息会发送到其他 broker 不会产生整个集群阻塞情况后来投放业务就将消息交互全部迁移到了 RocketMQ 上。

3、不可靠的 RedisMQ

之前视频基础服务使用了 RedisMQ 用来通知调用方视频数据发生了变化进行数据更新。而redis的消息推送基于 pub/sub 模式虽然实时性很高但是却不保证可靠而且消息不会进行持久化。

这两个缺点就导致了某些情况下调用方收不到通知而且消息丢失时基本无据可查。

所以此业务最终放弃了 RedisMQ 转而投向 RocketMQ。RocketMQ 能够保证消息至少被投递一次而且消息支持持久化即使客户端重启仍然可以从上次消费的地方继续消费。

4、低性能 ActiveMQ

用户视频基础服务之前使用了 ActiveMQ 主要用于通知依赖方数据变更它的消息体里包含了变更的数据。遗憾的是当消息量很大时 ActiveMQ 经常出现无法响应的情况甚至消费者出现长时间接收不到消息的情况。而了解到 RocketMQ 单个 broker 可以承担几十万 TPS 亿级消息堆积时此业务也迁移到了RocketMQ 上。

目前使用 RocketMQ 的业务包括视频基础服务用户服务直播业务付费业务审核等等业务系统。而 Kafka 大部分只用于日志相关的处理服务上比如日志上报业务日志收集等等。

另外随着 RocketMQ 支持的客户端越来越丰富也便于我们很多其他语言的业务接入比如 AI 组使用 python 客户端一些 GO 开发的业务使用 GO 客户端等。

运维之痛

初期我们运维 RocketMQ 基本靠命令行和 RocketMQ-Console。业务方经常来询问的问题包括如下

我有哪些机器在往这个topic发送消息发送消息怎么超时了发送失败能通知我吗消费失败了能通知我吗消息体是啥样的 RocketMQ集群不可用了能不能降级隔离我消费我的topic为啥导致别的业务消费混乱为啥还需要我自己序列化

问题很多而且千奇百怪

而作为运维人员除了调查解答业务方的问题之外在命令行运维 RocketMQ 更让我们小心翼翼。生怕脑子一时糊涂敲错一个命令造成大面积故障。随着运维的深入我们总结了一篇又一篇的使用规范最佳实践命名约定操作步骤等等的文章。但是随之发现这些文章对生产效率的提升并不明显。所以与其写文档不如将经验和实践转换为产品能够更好的服务于业务因此 MQCloud 应运而生。

MQCloud 诞生

先看一下 MQCloud 的定位

它是集客户端 SDK 监控预警集群运维于一体的一站式服务平台。MQCloud 的系统架构如下

接下来分别说明一下 MQCloud 如何解决上面提到的痛点。

1、业务端和运维端分离使业务用户只聚焦于业务数据

为了实现这个目的引入了用户资源两大维度。针对用户和资源加以控制使不同的用户只聚焦于自己的数据。

对于生产方来说他关心的是 topic 配置消息的发送数据谁在消费等等问题这样只对他展示相应的数据即可对于消费者来说只关心消费状况有没有堆积消费失败等情况对于管理员来说可以进行部署监控统一配置审批等日常运维

2、清晰明了的操作

通过对不同角色展示不同的视图使用户可以进行的操作一目了然。

3、规范和安全

为了保障集群操作的安全性和规范性所有的操作都会以申请单的形式进入后台审批系统管理员来进行相关审批安全性大大提升。

4、多维的数据统计和监控预警

MQCloud 核心功能之一就是监控预警目前支持如下预警

生产消息异常预警消费消息堆积预警 broker 角度消费客户端阻塞客户端角度消费失败预警消费偏移量错误预警消费订阅错误预警消费落后预警超出内存阈值从硬盘拉数据死消息预警消费失败太多消息进入死信队列消息流量异常预警消息存储耗时过长预警 broker 存储消息耗时 broker NameServer 宕机预警服务器宕机预警服务器 cpu 内存网络流量等指标预警

要想做监控必须先做统计为了更好的知道 RocketMQ 集群的运行状况 MQCloud 做了大量的统计工作大部分依赖于 broker 的统计主要包括如下几项

每分钟 topic 的生产流量用于绘制 topic 生产流量图及监控预警。每分钟消费者流量用于绘制消费流量图及监控预警。每10分钟 topic 生产流量用于按照流量展示 topic 排序。每分钟 broker 生产、消费流量用于绘制 broker 生产消费流量图。每分钟集群生产、消费流量用于绘制集群的生产流量图。每分钟生产者百分位耗时、异常统计以 ip 维度绘制每个生产者的耗时流量图及监控预警。机器的 cpu 内存 io 网络流量网络连接等统计用于服务器的状况图和监控预警。

下面捡一两点进行一下说明

1、生产异常耗时统计

由于 RocketMQ 并没有提供生产者的流量统计只提供了 topic 但是并不知道每个生产者的情况所以 MQCloud 实现了对生产者数据进行统计通过 RocketMQ 的回调钩子实现 :

主要统计如下信息

客户端 ip- broker ip发送消息耗时消息数量发送异常

统计完成后定时发送到 MQCloud 进行存储并做实时监控和展示。

关于统计部分有一点说明一般耗时统计有最大最小和平均值而通常 99% (即 99% 的请求耗时都低于此数值)的请求的耗时情况才能反映真实响应情况。99% 请求耗时统计最大的问题是如何控制内存占用因为需要对某段时间内所有的耗时做排序后才能统计出这段时间的 99% 的耗时状况。而对于流式数据做这样的统计是有一些算法和数据结构的例如 t-digest 但是 MQCloud 采用了非精确的但是较为简单的分段统计的方法具体如下

1、创建一个按照最大耗时预哈希的时间跨度不同的耗时分段数组

第一段耗时范围 0ms~10ms 时间跨度为 1ms。

第二组耗时范围 11ms~100ms 时间跨度 5ms。

第三组耗时范围 101ms~3500ms 时间跨度 50ms。

优点此种分段方法占用内存是固定的比如最大耗时如果为3500ms 那么只需要空间大小为96的数组即可缺点分段精度需要提前设定好且不可更改。

2、针对上面的分段数组创建一个大小对应的AtomicLong的计数数组支持并发统计

3、耗时统计时计算耗时对应的耗时分段数组下标然后调用计数数组进行统计即可参考下图

例如某次耗时为18ms 首先找到它所属的区间即归属于[16~20]ms之间对应的数组下标为12。

根据第一步找到的数组下标12 获取对应的计数数组下标12。

获取对应的计数器进行 1操作即表示18ms发生了一次调用。

这样从计数数组就可以得到实时耗时统计类似如下

4、然后定时采样任务会每分钟对计数数组进行快照产生如下耗时数据

5、由于上面的耗时数据天然就是排好序的可以很容易计算 99%、90%、平均耗时等数据了。

另外提一点由于 RocketMQ 4.4.0 新增的 trace 功能也使用 hook 来实现与 MQCloud 的统计有冲突 MQCloud 已经做了兼容。Trace 和统计是两种维度 trace 反映的是消息从生产- 存储- 消费的流程而 MQCloud 做的是针对生产者状况的统计有了这些统计数据才可以做到生产耗时情况展示生产异常情况预警等功能。

2、机器统计

关于集群状况收集主要采用了将nmon自动放置到/tmp目录定时采用ssh连接到机器执行nmon命令解析返回的数据然后进行存储。

上面这些工作就为监控和预警奠定了坚实的数据基础。

一、单独定制的客户端

针对客户端的一些需求 mq-client 在 rocketmq-client 的基础上进行了开发定制

1、多集群支持

MQCloud储存了生产者、消费者和集群的关系通过路由适配客户端可以自动路由到目标集群上使客户端对多集群透明。

2、透明的trace集群

通过搭建单独的trace集群和定制客户端使trace数据能够发往独立的集群防止影响主集群。

3、序列化

通过集成不同的序列化机制配合MQCloud 客户端无需关心序列化问题。

目前支持的序列化为protobuf和json 并且通过类型检测支持在线修改序列化方式。

4、流控

通过提供令牌桶和漏桶限流机制自动开启流控机制防止消息洪峰冲垮业务端也为需要精准控制流速的业务提供了方便。

5、隔离降级

针对生产消息使用hystrix提供了隔离api 使业务端在broker故障时可以避免拖累。

6、埋点监控

通过对客户端数据进行统计收集在MQCloud里进行监控使客户端任何风吹草动都能及时得知。

7、规范问题

通过编码保障使某些约定规范和最佳实践得以实现。包括但不限于

命名规范

消费组全局唯一防止重复导致消费问题

重试消息跳过

安全关闭等等

更完善的重试机制

二、近乎自动化运维

1、部署

手动部署一台 broker 实例没什么问题但是当实例变多时手动部署极易出错且耗时耗力。

MQCloud 提供了一套自动化部署机制包括停止写入上下线本地更新远程迁移包含数据校验 :

支持一键部署

另外 broker 作为 RocketMQ 的核心其配置有百项之多而且好多涉及到性能调优调整时往往需要根据服务器的状况谨慎调整 MQCloud 开发了配置模板功能来支持灵活的部署项

2、机器运维

MQCloud 提供了一整套机器的运维机制大大提升了生产力。

3、可视化的集群拓扑

三、安全性加固

1、开启管理员权限

RocketMQ 从 4.4.0 开始支持 ACL 但是默认没有开启也就是任何人使用管理工具或 API 就可以直接操纵线上集群。但是开启 ACL 对现有业务影响太大针对这种情况 MQCloud 进行专门定制。

借鉴 RocketMQ ACL 机制只针对 RocketMQ 管理员操作加固权限校验

并且支持自定义和热加载管理员请求码使得非法操作 RocketMQ 集群成为不可能安全性大大提升。

2broker 通信加固

broker 同步数据代码由于没有校验存在安全隐患只要连接 master 监听的 slave 通信端口发送数据大于 8 个字节就可能导致同步偏移量错误代码如下

MQCloud 通过验证数据首包的策略保障了通信的安全性。

if ((this.byteBufferRead.position() - this.processPostion) 8) {
int pos this.byteBufferRead.position() - (this.byteBufferRead.position() % 8);
long readOffset this.byteBufferRead.getLong(pos - 8);
this.processPostion pos;
HAConnection.this.slaveAckOffset readOffset;
if (HAConnection.this.slaveRequestOffset 0) {
HAConnection.this.slaveRequestOffset readOffset;
log.info( slave[ HAConnection.this.clientAddr ] request offset readOffset);
}
HAConnection.this.haService.notifyTransferSome(HAConnection.this.slaveAckOffset);
}

开源之路

目前 MQCloud 运维规模如下

服务器 50台集群 5个 topic 800个 consumer 1400 生产消费消息量/日 4 亿条生产消费消息大小/日 400G

MQCloud 在充分考虑和吸收实际业务的需求后以各个角色聚焦为核心以全面监控为目标以满足各业务端需求为己任在不断地发展和完善。

在 MQCloud 逐渐成熟之后秉承着服务于社区和吸收更多经验的理念我们开放了源代码。经过设计和拆分 MQCloud 于 18 年开源了从第一个版本 release 到现在已经过去两年了期间随着更新迭代大大小小一共 release 了 20 多个版本。其中不但包含功能更新、bug 修复、wiki 说明等而且每个大版本都经过详细的测试和内部的运行。之后很多小伙伴跃跃欲试来试用它并提出一些建议和意见我们根据反馈来进一步完善它。

我们将一直遵循我们的目标坚定的走自己的开源之路

为业务提供可监控可预警可满足其各种需求的稳定的 MQ 服务。积累 MQ 领域经验将经验转化为产品更好的服务业务。

默认标题_公众号封面首图_2021-07-29-0 (2).png

8月14日 RocketMQ x EventMesh Open Day 将在深圳举办。Apache RocketMQ Apache EventMesh(incubating)社区携手分别来自银行、保险、基金、券商顶级金融企业微众银行、平安人寿、博时基金、国信证券打造金融专场 Open Day。全天议程网罗 RocketMQ 5.0、EventMesh 社区最新动态、以及四大金融企业前沿实践、北京大学同款开源实操体验轻松上手、精美茶歇丰富礼品拿到手软丰富的整日议程不负夏日好时光。

本文转自网络，原文链接：https://developer.aliyun.com/article/786119
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：精彩回顾 | 阿里云 Serverless Developer Meetup 杭州站亮点有这 下一篇：【活动预告】推动中国云原生力量，阿里云云原生 GOTC 精彩抢鲜看

随机推荐

Nacos或者Config是怎么实现配置热刷新的

本文转载自网络，原文链接：https://mp.weixin.qq.com/s/vlOUg46B5bcmToX-fjavJQ...
阿里云发布工业大脑3.0，满足一站式开发

9月17日，2020云栖大会上，阿里云正式发布工业大脑3.0。阿里云智能资深产品专家...
VPS主机和租用服务器优势分析

在TOP云（zuntop.com）科技租赁过服务器的站长都知道独立服务器在价格上比VPS主...
云计算市场在2020年取得突破性增长

2020年对于云计算行业来说是突破性的一年，因为公共云供应商增加了收入，而疫情...
关于现代包管理器的深度思考-为什么现在

很长时间没有更新原创文章了，但是还一直在思考和沉淀当中，后面公众号会更频繁...
RDS PostgreSQL 安全最佳实践

一、PostgreSQL行业位置一行业位置首先我们看一看RDS PostgreSQL在整个行业当...
华瑞银行金融一朵云安全建设实践，智慧银

中国最?好的一朵云飘进了华瑞银行。阿里云将进一步助力华瑞银行All in Cloud。 -...
MySQL Case-索引key对select count(*)的

查看表结构，sbtest1有主键、k_1二级索引、i_c二级索引 CREATE TABLE `sbtest1` ...
在DevOps中整合“安全即代码”文化

最近，DevOps的采用导致了企业计算的重大转变。除无服务器计算，动态配置和即付...
JavaScript之深入理解this

定义 this是函数运行时自动生成的内部对象，即调用函数的那个对象。（不一定很准...

RocketMQ在搜狐的创新实践

推荐图文

尽管获三千万融资，该域名也换得了吧！

租用云服务器一年大概的费用

P2P鼻祖收购四字母域名LCAM.com！梦工厂、百事均有

2021年值得关注的8种边缘计算趋势

新零售行业优质解决方案分享【智能语音点餐机解决方

服务器托管节省开支节省费用

随机推荐

Nacos或者Config是怎么实现配置热刷新的

阿里云发布工业大脑3.0，满足一站式开发

VPS主机和租用服务器优势分析

云计算市场在2020年取得突破性增长

关于现代包管理器的深度思考-为什么现在

RDS PostgreSQL 安全最佳实践

华瑞银行金融一朵云安全建设实践，智慧银

MySQL Case-索引key对select count(*)的

在DevOps中整合“安全即代码”文化

JavaScript之深入理解this

关于我们