容器服务 TKE 的集群审计和事件存储为用户配置了丰富的可视化图表,以多个维度对审计日志和集群事件进行呈现,操作简单且涵盖绝大多数常见集群运维场景,易于发现和定位问题,提升运维效率,将审计和事件数据的价值最大化。
本文结合几个具体使用场景和示例,介绍如何利用审计和事件仪表盘快速定位集群问题。
已登录 容器服务控制台,并已开启 集群审计 和 事件存储。
10001****7138
账号在 2020-11-30T03:37:13
时删除了 nginx
应用。可根据账号 ID 在【访问管理】>【用户列表】中查找关于此账号的详细信息。10001****7138
账号在 2020-11-30T06:22:18
时对 172.16.18.13
节点进行了封锁操作。tke-kube-state-metrics
的访问量远高于其他用户,并且在 操作类型分布趋势 图中可以看出大多数为 list 操作,在 状态码分布趋势 图中可以看出,状态码大多数为403。结合业务日志可知,由于 RBAC 鉴权问题导致 tke-kube-state-metrics
组件不停的请求 apiserver 重试,导致 apiserver 访问剧增。日志示例如下:E1130 06:19:37.368981 1 reflector.go:156] pkg/mod/k8s.io/client-go@v0.0.0-20191109102209-3c0d1af94be5/tools/cache/reflector.go:108: Failed to list *v1.VolumeAttachment: volumeattachments.storage.k8s.io is forbidden: User "system:serviceaccount:kube-system:tke-kube-state-metrics" cannot list resource "volumeattachments" in API group "storage.k8s.io" at the cluster scope
2020-11-25
开始,节点 172.16.18.13
由于磁盘空间不足导致节点异常,此后 kubelet 开始尝试驱逐节点上的 Pod 以回收节点磁盘空间。开启了节点池弹性伸缩的集群,CA(cluster-autoscler)组件会根据负载状况自动对集群中节点数量进行增减。如果集群中的节点发生了自动扩(缩)容,用户可通过事件检索对整个扩(缩)容过程进行回溯。
event.source.component : "cluster-autoscaler"
event.reason
”、“event.message
”、“event.involvedObject.name
”、“event.involvedObject.name
” 进行显示,单击【检索分析】开始检索分析日志并将返回检索结果。2020-11-25 20:35:45
左右,分别由三个 nginx pod(nginx-5dbf784b68-tq8rd、nginx-5dbf784b68-fpvbx、nginx-5dbf784b68-v9jv5)
进行触发,最终扩增三个节点,后续的扩容由于达到节点池的最大节点数未再次触发。PaaS是(Platform as a Service)的缩写,是指平台即服务。 把服务器平台作为一种...
大数据已经进入我们生活的方方面面,为我们的生活带来诸多便利。因为大数据的存...
vlookup函数相信只要使用过Excel的同学都知道,这个函数在进行表格数据查询匹配...
关于阿里风控 阿里的风控主要分为两大块。一块是金融领域,主要业务是支付宝,另...
购买要求:新用户12~24 岁自动获得学生身份 阿里云地址: https://www.aliyun.com/...
手机端通过直播服务来推流和拉流实现视频直播业务,同时利用MQTT微消息、内容安...
功能介绍 本接口用于制作私有镜像,支持: 使用 云服务器 制作私有镜像。 使用上...
服务器托管 是客户本身的服务器放置在IDC服务商的机房,由客户自己远程维护的一...
现在您的网站不管是使用 虚拟主机 或者是 vps主机 或者是云主机等等,但是将来都...
您可以将本地的文件(例如配置文件、脚本等),通过发送文件功能上传到ECS实例。...