在数字化浪潮的推动下,AI 技术正以前所未有的速度渗透到各行各业,成为推动社会进步的重要力量,并同步革新企业组织模式,以此催化企业实现从技术、产品到组织的全方位立体化的转型升级。AI 将如何重塑现有的生产关系?我们又需要如何利用 AI 技术在现有的业务环节提高效率?
近日,QCon 在北京国测国际会议会展中心举办了“QCon 全球软件开发大会暨智能软件开发生态展”,各行各业的技术负责人在大会上分享实践洞见与深度经验,在这个汇聚了众多行业专家和前沿技术的平台上,蚂蚁集团的智能可观测平台负责人陈真(孜重),以蚂蚁智能可观测 Mpilot AI 助手落地实践为主题,分享了生成式 AI 在可观测领域的应用。
产品 AI 化趋势不可避免,蚂蚁集团的智能可观测平台作为技术革新的前沿阵地,很早就开始思考生成式 AI 在可观测领域有哪些应用?可观测性加上生成式 AI 究竟能给我们带来什么?
陈真认为,生成式 AI 主要能从以下三个方面给可观测产品带来较大的提升:
蚂蚁的可观测性平台其业务涵盖两大核心部分:Antmonitor 和 HoloInsight。Antmonitor 作为集团内部的可观测产品,主要针对内部规模化和复杂运维场景,处理百万级容器和每分钟数十 TB 的数据量。而 HoloInsight 则是近两年孵化的新产品,它轻量化、多样化,旨在服务于蚂蚁生态及开源社区,特别适用于出海业务、小站点业务和支付宝小程序云等生态业务。
图片面对业务的快速发展和技术的不断演进,蚂蚁可观测平台遇到了一系列挑战。其中包括模型推理能力的限制、输入限制以及多模态数据处理能力不足等。为了解决这些问题,团队采取了专注于核心场景的策略,并采用单场景模式进行深入探索,有效提升了错误日志分析、时序数据获取和告警处理的效率。
Mpilot 技术:智能观测的实践与应用
Mpilot 是蚂蚁智能可观测平台的关键组成部分,它结合了生成式 AI 技术,通过三个主要的助手 agent——时序助手、日志助手和告警助手——来提供服务。这些助手基于蚂蚁内部的百灵大模型和 向量数据库 运行,旨在将智能助手嵌入到用户的工作流中,提升效率。
Mpilot 的技术架构包括 Antmonitor、MaaS 函数插件服务和 Ceresdb 时序存储等组件的协同工作,为智能告警和故障恢复提供了强有力的支持。Mpilot 的技术架构由以下几个关键组成部分构成:
Mpilot 的应用场景覆盖了智能观测的多个方面:
通过 Mpilot 的不断迭代和优化,蚂蚁集团的智能可观测平台将更好地服务于内部和外部的业务需求,推动智能运维向更高水平发展。
HoloInsight 开源产品:技术共享与生态构建
HoloInsight 是蚂蚁集团推出的一款全功能的开源可观测性产品,它集数据采集、洞察分析、智能运维于一体。
HoloInsight 的设计理念是服务于小站点和生态场景,特别适用于支付宝小程序云等轻量级业务。同时支付宝小程序云也为支付宝小程序生态提供了基础设施支持,并将这套监控产品以 SaaS 形式进行输出。
HoloInsight 的技术架构基于 LLM 和 向量数据库,此外,HoloInsight-gpt 与蚂蚁开源的 CodeFuse 代码模型进行了整合,提供了一套私有化部署的解决方案,满足企业私有部署和安全合规的需求,同时 Holoinsight-gpt 也将规划发布到开源仓库。在支付宝小程序生态中,用户通常更加关注业务增长,在稳定性及质量上投入有限。因此,HoloInsight 的主要目标之一是降低运维门槛并快速定位技术故障原因,以支持用户的业务需求。
在应用上,HoloInsight 特别关注于小程序场景的定位和排查,如白屏问题。通过分析用户的访问路径和异常曲线,对比 向量数据库 中 Top 5 的案例,直接提供对应的解决方案,极大地提升了用户体验和业务效率。随着技术的不断进步,HoloInsight 也将继续深化行业合作,推动小程序应用与 AI 技术的融合与创新。
蚂蚁集团的智能可观测平台通过不断的技术创新和开放合作,正在重塑智能观测的交互模式,推动行业的发展。随着 AI 技术的不断进步,我们有理由相信,蚂蚁集团将在智能应用的新篇章中扮演更加重要的角色。