监控您的ECS实例是否健康非常重要,您需要确保用户始终可以快速打开您的网站和应用,或者快速完成数据处理和渲染等任务。阿里云提供了监控数据收集、可视化以及实时监控告警等服务,确保您的实例始终处于正常的运行状态。

背景信息

目前,您可以通过ECS自带监控服务和云监控服务监控实例。ECS自带监控服务提供vCPU使用率、网络流量和磁盘I/O监控。云监控提供更加精细化的监控粒度。以下是对部分监控信息的说明:
  • vCPU:阿里云提供实例vCPU使用率监控数据,单位为百分比。百分比数值越高,实例vCPU负载越高。您可以通过ECS管理控制台、云监控管理控制台、调用ECS API或者远程连接实例后查询监控数据。以下是远程连接实例后查看vCPU使用率的方式:
    • Windows实例:在任务管理器中查看vCPU使用情况,您可以按vCPU使用率排序,定位占用实例vCPU资源的进程。
    • Linux实例:运行top命令查看vCPU使用情况。在键盘上按下Shift+P根据vCPU使用率排序,定位占用实例vCPU资源的进程。
    说明 如果CPU持续保持高使用率,则会对系统稳定性和业务运行造成影响。您可以参见以下方法进行优化:
  • 网络流量:阿里云提供实例出方向和入方向的网络流量监控数据,单位为kbps。ECS自带监控服务一般提供公网流量监控,云监控可以获取公网和内网流量监控。例如,您的公网出网带宽为1 Mbps,当出网流量达到1024 kbps,表示您的公网带宽已经满负荷。

ECS自带监控服务

在ECS管理控制台上查看监控信息的步骤如下所示。

  1. 登录ECS管理控制台
  2. 在左侧导航栏,单击实例与镜像 > 实例
  3. 在顶部菜单栏左上角处,选择地域。
  4. 找到目标实例,单击实例ID。
  5. 实例详情页,单击监控页签。
  6. 设置监控时间范围,看到vCPU使用率等监控信息。
    最新状态
    说明 由于显示的聚合方式不一样,选择时间段的长短会影响显示的精度。选择时间范围越小,显示效果越精细。例如,1小时和6小时的平均值会显示不一样的结果。

您也可以使用DescribeInstanceMonitorDataDescribeDiskMonitorDataDescribeEniMonitorData接口获取监控数据。

以下为ECS自带监控项的详细列表,指标采集粒度为1分钟。
监控项 描述及单位
实例 实例ID
vCPU 实例vCPU的使用比例,单位:%
内网入方向流量 实例在接收的内网数据流量,单位:kbits
内网出方向流量 实例在发送的内网数据流量,单位:kbits
内网带宽 实例内网带宽,单位时间内的网络流量,单位:kbits/s
公网入方向流量 实例接收的公网数据流量,单位:kbits
公网出方向流量 实例发送的公网数据流量,单位:kbits
公网带宽 实例公网带宽,单位时间内的网络流量,单位:kbits/s
系统盘读操作 系统盘每秒读取字节总数,单位:次/s
系统盘写操作 系统盘每秒写入字节总数,单位:次/s
系统盘读带宽 系统盘每秒读取次数,单位:Byte/s
系统盘写带宽 系统盘每秒写入次数,单位:Byte/s
说明
  • Kb和KB的区别如下:
    • 1 Byte=8 bits(1B=8b)。
    • 使用大写K或小写k表示千时,Kb即为千位,KB即为千字节。
    • ECS自带的网络流量监控中,ps指/s,即每秒。kbps指网络速度,即每秒传送多少千位信息。通常情况下,描述带宽时常省略bps。例如,4 M带宽的完整写法应为4 Mbps。
  • 带宽不等于下载速度:以1 Mbps带宽为例,1 KB=8 Kb,1 Mbps=125 KB/s,1 kbps=1000 bps。1 Mbps带宽的下载速率,理论上为125 KB/s,而实例中一些应用程序会占用少量带宽,例如远程连接,因此实际下载速率常为100 KB/s~110 KB/s。

云监控

云监控为您提供开箱即用的企业级开放型一站式监控解决方案。云监控为您的ECS提供主机监控服务:
  • 云监控中的主机监控介绍,请参见概览
  • 云监控中的主机监控项和监控指标,请参见监控项说明

在云监控管理控制台上获取ECS实例监控数据的操作步骤如下所示。

  1. 登录云监控管理控制台
  2. 在左侧导航栏中,单击主机监控
  3. 找到目标实例。
  4. 可选:如果实例未安装云监控插件,单击点击安装更新插件。
  5. 单击监控图表获取监控数据。
    说明 监控数据保留最大天数为30天。
  6. 单击报警规则设置报警规则。
设置报警规则