调用RecoverCluster重置并修复异常集群。

接口说明

您可以调用DescribeCluster查询集群详细信息,如果集群状态为exception(异常)时,调用该接口重置并修复集群。

操作前请务必确认已导出所有作业数据。重置集群会有以下影响:

  • 集群所有节点实例执行更换系统盘的操作,按创建集群时的配置重新配置系统盘。
  • 集群所有节点实例系统盘和数据盘的数据将会丢失,包括用户信息、作业信息、调度器队列信息、自动伸缩队列配置信息,但文件存储NAS上的数据仍然保留。
  • 集群自建队列被清除,节点实例继续保留,并全部迁移到集群默认队列中。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

请求参数

名称 类型 是否必选 示例值 描述
Action String RecoverCluster

系统规定参数。取值:RecoverCluster

ClusterId String ehpc-hz-FYUr32****

指定重置并修复的集群ID。

OsTag String CentOS_7.2_64

操作系统镜像标签,您可以通过ListImages查询E-HPC可安装的镜像列表。

AccountType String nis

账户服务类型。取值范围:

  • nis
  • ldap
SchedulerType String pbs

调度服务器类型。取值范围:

  • pbs
  • slurm
  • opengridscheduler
  • deadline
ImageOwnerAlias String system

镜像类型。取值范围:

  • system:公共镜像
  • self:自定义镜像
  • others:共享镜像
  • marketplace:镜像市场镜像
ImageId String m-bp18133n0335yq****

镜像ID。

ClientVersion String 1.0.76

集群所使用的客户端版本号。

返回数据

名称 类型 示例值 描述
RequestId String 18FB21E3-F423-4B84-BB63-D8887A2927AB

请求ID。

TaskId String 18FB21E3-F423-4B84-BB63-D8887A2927AB

任务ID。

示例

请求示例

https://ehpc.cn-hangzhou.aliyuncs.com/?Action=RecoverCluster
&ClusterId=ehpc-hz-FYUr32****
&<公共请求参数>

正常返回示例

XML格式

<RecoverClusterResponse>
      <TaskId>18FB21E3-F423-4B84-BB63-D8887A2927AB</TaskId>
      <RequestId>18FB21E3-F423-4B84-BB63-D8887A2927AB</RequestId>
</RecoverClusterResponse>

JSON格式

{
	"TaskId": "18FB21E3-F423-4B84-BB63-D8887A2927AB",
	"RequestId": "18FB21E3-F423-4B84-BB63-D8887A2927AB"
}

错误码

HttpCode 错误码 错误信息 描述
503 ServiceUnavailable The request has failed due to a temporary failure of the server 请求失败,服务暂时不可用

访问错误中心查看更多错误码。