作者 | 白玙
随着容器技术蓬勃发展与落地推行 越来越多企业的业务运行于容器中。作为主流部署方式之一 容器将团队的任务和关注点分割开 开发团队只需关注应用程序逻辑和依赖项 而运维团队只需关注部署和管理 无需再为特定软件版本和应用程序特定配置等应用程序细节而提心吊胆。这意味着开发团队和运维团队可以花费更少时间进行调试上线 将更多时间用于向最终用户交付新功能。容器使企业可以更加轻松的提高应用程序可移植性和操作弹性。据 CNCF 的调研报告显示 73% 受访者正在使用容器来提高生产敏捷性并加快创新速度。
在大规模使用容器过程中 面对高动态且需要持续监测的容器化环境 建立监测体系对于维持运行环境稳定、优化资源成本具有巨大意义。每个容器镜像可能有大量运行实例 由于新镜像和新版本的引入速度很快 故障很容易通过容器、应用程序和架构扩散。这使得在问题发生后 为了防止异常扩散 立即进行问题根因定位变得至关重要。经过大量实践 我们认为在容器使用过程中 以下组件的监测至关重要
在完整的监测体系下 通过深入了解指标、日志和链路 团队不仅可以了解在集群以及在容器运行时和应用程序中发生的事情 也可以为团队进行业务决策时提供数据支持 比如何时扩展/缩减实例/任务/Pod、更改实例类型。DevOps 工程师还可以通过添加自动化告警以及相关配置 来提高故障排除以及资源管理效率 比如通过主动监测内存利用率 当资源消耗接近所设定的阈值时通知运维团队对可用 CPU 、内存资源耗尽之前添加额外节点。这其中的价值包括
但在实际落地过程中 运维团队会觉得以上价值相对浅显 似乎现有运维工具都能达到上述目的。但针对容器相关场景 如果无法构建相应监测体系 随着业务不断扩张 就不得不面临以下两个非常棘手的针对性问题
开发团队与运维团队很难了解正在运行的内容及其执行情况。维护应用程序、满足 SLA 和故障排除异常困难。
按需快速扩展应用程序或微服务实例的能力是容器化环境的重要要求。监测体系是衡量需求和用户体验的唯一可视化方法。扩展太晚 导致性能与用户体验的下降 过晚缩小规模 又会导致资源以及成本的浪费。
因此 当容器监测的问题以及价值 不断叠加且浮出水面 越来越多运维团队开始重视容器监测体系的搭建。但在实际落地容器监测这一过程中 又遇到各种各样意料之外的问题。
比如短暂存在特性带来的跟踪困难 由于容器自身存在着复杂性 容器不仅包含底层代码 还包含应用程序运行所需的所有底层服务。随着新部署投入生产 并更改代码和底层服务 容器化应用程序会频繁更新 这就增加了出错的可能。快速创建、快速销毁的特性 使得在大规模复杂系统中跟踪变化变得异常困难。
又比如 由于共享资源带来的监控困难 由于容器使用的内存和 CPU 等资源在一台或多台主机之间共享 因此很难监控物理主机上资源消耗情况 也导致很难获得容器性能或应用程序健康状况的良好指示。
最后 就是传统工具难以满足容器监测需求。传统的监测解决方案通常缺乏虚拟化环境所需的指标、跟踪和日志所需的工具 容器的健康和性能指标及工具更是如此。
因此 结合以上的价值、问题、难点 我们在建立容器监测体系时 需要从以下几个维度进行考量与设计
在明确业务需求以及设计监测体系过程中 有非常多开源工具供运维团队选择 但运维团队还需要评估可能存在的业务与项目风险。这其中包括
因此 基于上述洞察考量与大量实践经验 阿里云推出 Kubernetes 监测服务。阿里云 Kubernetes 监测是一套针对 Kubernetes 集群开发的一站式可观测性产品。基于 Kubernetes 集群下的指标、应用链路、日志和事件 阿里云 Kubernetes 监测旨在为 IT 开发运维人员提供整体的可观测性方案。阿里云 Kubernetes 监测具备以下六大特性
与此同时 相对于与开源容器监测 阿里云 Kubernetes 监测具备更加贴近业务场景的差异化价值
基于以上产品特性与差异化价值 我们应用在以下场景
目前 Kubernetes 监测已经开启全面公测 公测期间免费使用。让 Kubernetes 监测帮你摆脱机械重复的运维工作
WEB服务器也称为WWW(WORLD WIDE WEB) 服务器 ,主要功能是提供网上信息浏览服务...
众所周知,job有工作的含义,非常适合招聘类企业应用。通常,带有job的 域名 出...
可视化搭建平台除了需要为用户提供简单便捷的操作方式之外, 还需要提供丰富的组...
研究表明,到2025年,企业80%的计算能力将在云端产生。但是,很多企业在迁移到云...
公司简介 我们网鱼网咖成立于1998年,致力于打造多人游戏空间,为顾客提供极致的...
本文转载自微信公众号「码农读书」,作者码农读书。转载本文请联系码农读书公众...
前言 Spring Boot没有火起来之前,使用SSM架构的项目那是相当的多,现在也有不少...
2月份GitHub上最热门的JavaScript开源项目排行已经出炉啦,一起来看看吧: 1. th...
本文作者 阿里云技术专家李雨前 引言 业务上云常态化 业务在云上资源的选购、弹...
如果你的工作离不开奇思妙想和可爱元素,却想让潜在用户知道你是认真的,那你可...