工作负载状态异常时,建议先查看K8S事件以便于确定导致异常的初步原因,再参照表2中的内容针对性解决问题。
在CCE控制台中,单击左侧导航栏的“工作负载”,单击异常工作负载名称,进入详情页面,查看实例最新事件,详细步骤如下:
如下图,K8S事件提示为“0/163 nodes are available: 133 Insufficient memory”,此时工作负载状态为“未就绪”,事件为“实例调度失败”,即表示内存不足。
事件信息 |
说明 |
解读 |
---|---|---|
no nodes available to schedule pods |
表示没有节点资源调度工作负载实例。 |
/ |
0/163 nodes are available: 133 Insufficient memory |
表示节点可用,但内存不足。 |
|
163 Insufficient cpu |
表示CPU不足。 |
163个节点CPU不足。 |
49 Insufficient nvidia.com/gpu |
表示nvidia.com/gpu不足。 |
49个节点GPU不足。 |
49 InsufficientResourceOnSingleGPU |
表示GPU资源不足。 |
/ |
0/2 nodes are available: 1 node(s) didn't match pod affinity/anti-affinity, 1 node(s) had taints that the pod didn't tolerate. |
由于工作负载的反亲和策略,导致新增Pod无法调度到已经运行该工作负载Pod实例的节点上。 |
/ |
若出现此K8S事件,请参照下方几种方式排查工作负载异常原因。
以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低频率原因排查,从而帮助您快速找到问题的原因。
如果解决完某个可能原因仍未解决问题,请继续排查其他可能原因。
事件或状态异常信息 |
处理措施 |
---|---|
K8S事件提示“实例调度失败” |
|
K8S事件提示“重新拉取镜像失败” |
|
K8S事件提示“重新启动容器失败” |
|
实例状态为“Evicted”,pod不断被驱逐 |
|
K8S事件提示“实例挂卷失败” |
|
实例状态一直为“创建中” |
|
实例状态一直为“结束中” |
|
实例状态为“已停止” |
请参考工作负载异常:已停止 |
如果上述方法均不能解决您的疑问,请提交工单寻求更多帮助。
访问密钥AccessKey(AK)相当于登录密码,只是使用场景不同。AccessKey用于程序...
企业需要使用正确的数据分析工具来控制其业务支出。在保持精益运营的过程中,很...
很多站长都会选择自己选择 服务器租用 业务来搭建网站,而网站搭建的前期工作就...
TOP云 (west.cn)3月6日消息,近日组合 域名 wegame.com曝出交易,在大家对背后...
当您不再需要某一快照时,您可以手动删除。 背景信息 手动创建和自动创建的快照...
近期,由区块链和数字货币引起淘金热在 域名 圈内持续发酵,相关域名被高价收购...
无论您是想成为Web设计人员,游戏开发人员,机器学习爱好者,还是任何其他相关技...
美国前邮政部长,美国百货商店之父,约翰华纳梅克(John Wanamaker)感叹到:「我...
域名 没有实名能用吗?在国内要求实名的域名没有实名,是不能用的。 域名注册 后...
甲骨文公司近日宣布,凭借强大的执行力和愿景完整性,甲骨文在 Gartner 2019 年...