对于运维的日常工作来说 服务器监控是必须且最基础的一项内容。在企业基础设施运维过程中 管理员必须能够掌握所有服务器的运行状况 以便及时发现问题 尽可能减少故障的发生。本次主要介绍如何使用智能巡检 帮助您快速完成机器 ECS 相关指标的监控 降低您设置告警的复杂规则和冗余的设置。
设置步骤创建MetricStore 完成机器组配置创建MetricStore选择需要监控的机器 安装Logtail采集插件等待插件安装完成针对配置的机器 将完成采集的机器组设置针对机器指标的采集配置SLS的主机监控方案非常简单 只需要安装一个Logtail就可以采集各个主机的基础指标 服务端都是云化 无需运维 默认SLS提供了可视化的仪表盘 也可以通过Grafana来进行更加专业的可视化。
目前Logtail采集了主机常用的基础指标 包括CPU、内存、网络、磁盘等 其中对较为关键的指标都做了可视化 便于直接查看。通过对采集配置中 插件配置 的模式下 使用如下配置 可以完成上述指标的采集。
{ inputs : [ detail : { IntervalMs : 30000 type : metric_system_v2 }
在接入的过程中 有个辅助的开关【开启指标巡检】 如果选择了开启 则会同时创建对应的【巡检任务】和存放巡检结果的LogStore。我们通过如下操作 可以查看对应的资源情况。
结果分析基础数据分析* | select DISTINCT __name__ from machine_metric_logtail.prom where __name__ ! limit 10000
在MetricStore中 使用如上的分析语句 可以查看我们一共采集了多少指标 以及对应的指标内容。
智能巡检结果可视化如何使用巡检大盘用户可以在【巡检大盘】中选择【异常列表】中对应【hostname】这一列 选择从机器维度出发 去查看对应的异常情况在【异常显示】部分 每个异常都会标注在指标的曲线中 您可通过鼠标拖拽选择时间区间 点击异常点查看异常详情并跳转到详细的监控页面用户可以在【仪表盘】中 找到对应的【巡检仪表盘】 可以通过手动拖拽的形式选中对应的区间 可以完成多个图表联动的可视化 更加便于您查看单个机器的状态是否正常。
参考文档采集主机监控数据 https://help.aliyun.com/document_detail/171717.html?spm a2c4g.11186623.6.980.7c2515c0cE8RiuAIOps 自适应机器学习异常检测 https://zhuanlan.zhihu.com/p/377837205智能巡检概述 https://help.aliyun.com/document_detail/253411.html查看巡检结果 https://help.aliyun.com/document_detail/275370.html打标反馈 https://help.aliyun.com/document_detail/275225.html本文转载自公众号读芯术(ID:AI_Discovery)。 在学生时代,笔者总想设计一个自己...
云服务器 性能怎么样?整体来说, 云服务器 的性能是优于 虚拟主机 的, 云计算 ...
青岛 云服务器 哪家好?目前,国内外提供 云服务器 的厂商很多,有知名大品牌也...
本文转载自公众号读芯术(ID:AI_Discovery) 与其他技术角色不同,数据工程没有那...
由于站长选择国内的 虚拟主机 需要备案,备案时间较长(20天左右),而且过程繁...
公司简介 Timing App成立于2017年5月12日,是武汉氪细胞网络技术有限公司旗下的...
根据ntldstats.com最新数据显示,截至2016年8月4日, .top域名 已突破300万大关...
郑州TOP云(zuntop.com)科技双线机柜租用,自助投资千万建设(绿谷云数据中心)四...
域名注册 需要实名认证吗?目前,在我国注册的大部分 域名 都需要实名认证,但也...
作者 黄鹏程 马格 一、Tair背景介绍 一 什么是阿里云Tair云原生内存数据库 阿里...