问题现象:
job的pod已经执行完成的情况下,依然有实例在挂卷等事件,并且事件信息是失败的。
问题原因:
各种类型的POD(Deployment/StatefulSet/Job/CronJob)在Node上启动时:
对于long running的POD(Deployment/StatefulSet),除了类似镜像拉取失败、存储挂载失败、容器网络分配失败、当前节点CPU/Mem不满足POD的实际使用要求等异常场景外,POD容器若最终都会启动成功时,上述podWorker在几次周期后都会判定挂载成功。
而对于短时运行的POD(Job/CronJob),由于容器中业务存在正常退出(如问题场景的GCS Demo job只执行一些echo和ls命令,总体耗时1s不到),就存在短时POD运行退出时若刚好在两次podwork检测volume挂载周期中,那么就会出现本问题单所述的误报,但是不影响业务使用,且实际的Job业务还是会运行超过上述时间的。
当前kubelet上述能力属于社区挂载框架既有能力。
解决方法:
针对短时运行的POD(Job/CronJob),可能存在由于运行时间过短而误报卷挂载超时的情况,若这类短时运行任务属于正常退出,则该误报对业务没有影响可以忽略。
数字化转型到云原生概述 今天重新整理下企业数字化和云原生解决方案。这个我在前...
【51CTO.com快译】由于构建可扩展、且高度可靠的软件系统,是每个SRE(Site Relia...
Windows Server 2003默认情况下是没有安装POP3和SMTP服务组件的,因此我们要手工...
虎扑作为国内最大的体育互联网平台 为用户提供体育新闻、互动社区、电子商务、赛...
作者: 杨文熙 腾讯IEG游戏运营 导语| 作为腾讯首款沙盘战略手游,《鸿图之下》...
近年来,数字化转型一词被进行了过多的炒作。对于某些人而言,这是将数字技术集...
通过本文你将了解canvas简介及其比较常用的方法,并利用canvas实现一个小猪头。 ...
可扩展企业级图数据库TigerGraph,今日宣布将在9月28-30日面向全球在线举办Graph...
? 前提条件: K8S集群中正确部署了virtual-kubelet(Serverless Kubernetes 默认...
如果您了解容器引擎的使用,Dockerfile文件的一些配置如何对应到云容器实例中去...