当集群状态为“可用”,而集群中部分节点状态为“不可用”时,请参照如下方式来排查解决。
以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低频率原因排查,从而帮助您快速找到问题的原因。
如果解决完某个可能原因仍未解决问题,请继续排查其他可能原因。
问题描述:
集群中节点连接异常,多个节点报写入错误,业务未受影响。
问题定位:
当节点cpu和内存负载过高时,会导致节点网络时延过高,或系统OOM,最终展示为不可用。
解决方案:
节点恢复为可用后,工作负载即可恢复正常。
登录CCE控制台,选择左侧导航栏的“资源管理 > 集群管理”,确定集群是否可用。
如果节点名称不一致,并且密码和密钥均不能登录,说明是ECS创建虚机时的cloudinit初始化问题,临时规避可以尝试重启节点,之后再提单给ECS确认问题根因。
控制节点安全组名称为:集群名称-cce-control-编号。如下图示例,集群名称为:***-cce-control-***。
安全组入方向规则解读:
请检查安全组规则中是否包含Master和Node互通的安全组策略。
已有集群添加节点时,如果子网对应的VPC新增了扩展网段且子网是扩展网段,要在控制节点安全组(即集群名称-cce-control-随机数)中添加如下三条安全组规则,以保证集群添加的节点功能可用(新建集群时如果VPC已经新增了扩展网段则不涉及此场景)。下图中的源地址为节点网段。
在v1.7.3-r7版本后的集群中新建节点后,会给节点绑定一个100G的docker专用数据盘。若数据盘卸载或损坏,会导致docker服务异常,最终导致节点不可用。
请检查节点挂载的数据盘是否已被卸载。若已卸载请重新挂载数据盘,再重启节点,节点可恢复。
登录方法请参见登录Linux弹性云服务器。
1.13版本,命令示例如下:
systemctl status kubelet
执行失败,请提交工单联系技术支持;执行成功,可查看到各组件的状态为Active,如下图:
若服务的组件状态不是Active,执行如下命令:
重启命令根据出错组件指定,如canal组件出错,则命令为:systemctl restart canal
重启后再查看状态:systemctl status canal
1.13之前版本,命令示例如下:
su paas -c '/var/paas/monit/bin/monit summary'
执行失败,请提交工单联系技术支持;执行成功,可查看到各组件的状态,如下图:
若有服务的组件状态不是Running,请尝试重启对应服务。例如下图所示为canal组件异常:
重启命令为:su paas -c '/var/paas/monit/bin/monit restart canal'
重启后再查看状态:su paas -c '/var/paas/monit/bin/monit summary'
此时,各组件的Status都为Running状态,如下图:
ps -ef | grep monitrc
kill -s 9 `ps -ef | grep monitrc | grep -v grep | awk '{print $2}'`
解决方案:
systemctl status docker
若执行失败或服务状态非active,请确认docker运行失败原因,必要时可提交工单联系技术支持。
docker ps -a | wc -l
若命令卡死、执行时间过长或异常容器数过多(1000以上),请确认外部是否存在重复不断地创删负载现象,在大量容器频繁创删过程中有可能出现大量异常容器且难以及时清理。
在此场景下可考虑停止重复创删负载或采用更多的节点去分摊负载,一般等待一段时间后节点会恢复正常,必要情况可执行docker rm {container_id}手动清理异常容器。
近日 中国功效护肤第一股——云南贝泰妮生物科技集团股份有限公司 股票代码30095...
1. 接口描述 接口请求域名: tcr.tencentcloudapi.com 。 用于个人版镜像仓库中...
TOP云 (west.cn)5月4日消息,四月份国外平台Namejet成交金额为125万美元,其中...
中国语言博大精深,同样的词汇变换不同的语调表达出来的含义千差万别,更不同说...
TOP云 (west.cn)1月29日消息,此前有传言称极品两字母 域名 GB.COM易主,近日...
挂机用什么 云服务器 ?很多游戏玩家,对挂机可能耳熟能详,大家平常忙,会需要...
根据PMMI商业智能的一份最新报告,目前47%的领先CPG和46%的中小企业正在使用云计...
编者按:都是未来是大数据时代,数据是新的石油,但是彭博的一篇文章却对此提出...
云服务器 公司有哪些? 云服务器 行业发展了很多年,要说做 云服务器 的公司,那...
11月9日,全国信息安全标准化技术委员会WG5工作组全体会议在北京召开。由中国信...