当前位置:主页 > 查看内容

升级集群_云容器引擎 CCE_用户指南_集群管理_集群升级

发布时间:2021-09-23 00:00| 位朋友查看

简介:操作场景 您可以通过云容器引擎管理控制台快速升级到Kubernetes最新版本或者bugfix版本,以支持新特性的使用。 升级前,请先了解CCE各集群版本能够升级到的目标版本,以及升级方式和升级影响,详情请参见 集群版本升级说明 。 注意事项 集群升级属于不可逆操……

操作场景

您可以通过云容器引擎管理控制台快速升级到Kubernetes最新版本或者bugfix版本,以支持新特性的使用。

升级前,请先了解CCE各集群版本能够升级到的目标版本,以及升级方式和升级影响,详情请参见集群版本升级说明

注意事项

  • 集群升级属于不可逆操作,升级后无法回滚到之前版本,请谨慎进行。
  • 请在升级集群前,请查看集群状态是否均为健康状态。若集群不正常,您可以自行修复,若仍有问题请提交工单联系我们协助您进行修复。
  • 为了您的数据安全,强烈建议您先备份数据然后再升级,升级过程中不建议对集群进行任何操作。
  • 升级前,请在CCE控制台中确认您的集群是否可以进行升级操作,确认方法:单击“资源管理 > 集群管理”,查看待升级集群右上角是否存在“可升级”提示,若存在则该集群支持升级,若不存在,则该集群不支持升级。更多详细信息请参见集群版本升级说明
    图1 集群-可升级

前提条件

请在集群升级前检查集群和节点的健康状况,确保集群和节点正常可用。

检查方式一:控制台查看

在CCE控制台中,单击左侧栏目树的“资源管理”,分别单击“集群管理”“节点管理”,查看集群和节点的状态是否正常。

检查方式二:Kubectl命令查看

  1. 配置Kubectl命令,具体请参见通过Kubectl连接集群
  2. 执行如下命令,确保集群的所有模块都处于健康状态。

    kubectl get cs

    命令行终端显示如下信息:
     NAME                 STATUS    MESSAGE              ERROR
     scheduler            Healthy   ok
     controller-manager   Healthy   ok
     etcd-0               Healthy   {"health": "true"}
     etcd-1               Healthy   {"health": "true"}
     etcd-2               Healthy   {"health": "true"}

  3. 执行如下命令,确保所有节点都处于Ready状态。

    kubectl get nodes

    所有节点只能Ready状态,不能包含其他状态。

     NAME                   STATUS    ROLES     AGE       VERSION
     cn-north-4a-xxx   Ready     master    38d       v1.9.7-r1
     cn-north-4a-xxx   Ready     <none>    38d       v1.9.7-r1
     cn-north-4a-xxx   Ready     <none>    38d       v1.9.7-r1
     cn-north-4a-xxx   Ready     <none>    38d       v1.9.7-r1
     cn-north-4a-xxx   Ready     master    38d       v1.9.7-r1
     cn-north-4a-xxx   Ready     master    38d       v1.9.7-r1

集群升级前排查项

在集群升级前,请根据如下Checklist进行排查,以便提前发现风险和问题。

表1 集群升级排查项

类别

检查项

集群

确认当前集群的Node IP(包括EIP),是否有作为其他的配置或者白名单等。

执行升级前预检查功能。

工作负载

记录工作负载的数量、工作负载状态,便于升级后对比。

针对您使用的数据库(例如云专线Redis、Mongdb等),要提前考虑白名单、路由或安全组策略变化等问题。

存储

记录存储状态,保证升级后存储不丢失。

网络

检查使用的负载均衡服务、Ingress,并做好备份。

针对使用云专线的业务场景,需重点关注业务所在节点或实例IP发生变化时,应提前在云专线开通路由。

插件

社区Kubernetes 1.9版本升级1.11版本时,集群的kube-dns会被卸载并替换为CoreDNS,请备份您配置在kube-dns中的DNS地址,以便在域名解析异常时重新在CoreDNS中进行配置。

运维

私有配置:在升级前的集群中检查是否在节点或容器中放置了数据面密码、证书、环境变量等配置,当容器重启(例如节点异常重新调度pod),会导致配置丢失,业务异常。

检查并备份内核参数或者系统配置。

操作步骤

本章节以将CCE集群v1.11.7-r2升级到v1.13.10-r1版本为例进行说明,其他集群操作请参考本例。

  1. 登录云容器引擎管理控制台,单击左侧导航栏的“资源管理 > 集群管理”,在集群列表页面查看您的集群版本,本例以v1.11.7-r2版本的集群为例。

    图2 升级集群

  2. 单击待升级集群右下角的“更多 > 集群升级”

    若您的集群当前已是最新版本,则“集群升级”按钮为灰色不可用状态。

  3. 在弹出的“升级前预检查”对话框中,单击开始检查

    图3 升级前预检查

  4. 升级前预检查开始启动,在此过程中集群状态将显示为“预检查中”,期间该集群不能进行新业务下发,运行中的业务不受影响,该过程将持续3-5分钟。

    图4 升级前预检查-进行中

  5. 待升级前预检查的状态显示为“已完成”时,单击“去升级”

    图5 升级前预检查-完成

  6. 进入集群升级页面,参照表2确认或配置基本信息。

    表2 基本信息确认与配置

    参数

    参数说明

    集群名称

    请确认您要升级的集群名称。

    当前版本

    请确认待升级集群的版本。

    升级后版本

    请确认升级后的目标版本。

    节点升级策略

    重置升级:控制节点采用平滑升级方式,而用户节点采用重置安装方式,节点操作系统将会被重装,系统盘和数据盘的数据均会被清空,请谨慎使用。

    说明:
    • 本集群的节点及工作负载生命周期管理功能暂不可用。
    • API访问功能暂不可用。
    • 由于升级过程节点进行重置安装,用户已运行的工作负载业务将会中断。
    • 用户节点的系统盘和数据盘将会被清空,升级前请事先备份重要数据。
    • 用户节点上挂载的非LVM管理的数据盘,升级后需要重新挂载,盘中数据不会丢失。
    • 云硬盘的配额需大于0。
    • 容器的IP地址会发生变化,但是不影响容器间的网络通信。
    • 用户节点的自定义标签将不会保留。
    • 集群升级时间约为12分钟。

    滚动升级:控制节点采用平滑升级方式,用户节点采用节点池滚动升级,适用于集群下节点均采用节点池创建的场景。

    说明:
    • 本集群的节点及工作负载生命周期管理功能暂不可用。
    • API访问功能暂不可用。
    • 用户已运行的工作负载业务不会中断。
    • 集群升级时间约为12分钟。

    登录方式

    支持密码和密钥对。
    • 选择“密码”:用户名默认为“root”,请输入登录节点的密码,并确认密码。

      登录节点时需要使用该密码,请妥善管理密码,系统无法获取您设置的密码内容。

    • 选择“密钥对”:选择用于登录本节点的密钥对,支持选择共享密钥。

      密钥对用于远程登录节点时的身份认证。若没有密钥对,可单击选项框右侧的“创建密钥对”来新建,创建密钥对操作步骤请参见创建密钥对

    节点升级优先级

    可选择优先升级的节点。

  7. 完成后单击“下一步”,在弹出的“集群升级”对话框中单击“确定”

    根据您选择的“节点升级策略”,对话框中会有如下两种不同的提示:
    • 重置升级:升级后的集群版本将使用更高版本操作系统,升级将会重启节点并升级操作系统版本,升级过程中运行的业务会暂时中断。
    • 滚动升级:滚动升级后,需要用户重置节点(同时去除不可调度标签)或新建节点才能完成升级。

  8. 进入“升级插件”步骤,如有需要升级的插件会有红色圆点提示,请单击插件卡片左下角的“升级”按钮,完成后单击页面右下角的“升级”

    • 集群将依次升级控制节点,然后并发升级用户节点。用户节点较多时,节点将分批升级。
    • 请选择合适的时间段进行升级,以减少升级对业务的影响。
    • 单击“升级”会立刻开始执行升级操作,并且无法撤销。升级过程中请勿对节点执行关机、重启等操作。

  9. 在弹出的“集群升级”对话框中阅读提示信息,确认后单击“确定”,注意集群升级后不可回退。

    图6 集群升级确认

  10. 在集群列表页面中可以看到集群的状态为“升级中”,升级过程需要一定的时间,请耐心等待升级完成。

    • 升级成功后,您可以在集群列表或集群详情页面查看升级后的集群状态和版本。
      图7 确认升级成功
    • 如果升级失败,请参考2~9重新进行升级集群操作,若仍有问题请提交工单联系我们协助您进行修复。


本站部分内容转载于网络,版权归原作者所有,转载之目的在于传播更多优秀技术内容,如有侵权请联系QQ/微信:153890879删除,谢谢!
上一篇:负载均衡 更新历史 - API 文档 下一篇:没有了

推荐图文

  • 周排行
  • 月排行
  • 总排行

随机推荐