最近更新时间:2026-05-20 16:38:07
可以通过以下方式排查原因:
查看任务状态:在训练任务中单击指定任务,进入 任务概览 > 实例栏 > 状态,鼠标悬停于「失败」状态上,会显示失败原因。
查看任务日志:在训练任务中单击指定任务,切换到 日志 页签,查看具体的错误信息。
有两种设置方式:
方式一:设置环境变量
export KSYUN_SECRET_ID=<您的SecretId>
export KSYUN_SECRET_KEY=***方式二:直接在代码中配置
cred = credential.Credential(
"您的secretId",
"您的secretKey"
)或
cred = credential.Credential(
os.environ.get("KSYUN_SECRET_ID", "您的AK"),
os.environ.get("KSYUN_SECRET_KEY", "您的SK")
)使用平台官方镜像或自定义镜像时:
只需填写 imageId 字段(填入平台镜像管理中看到的镜像 ID),无需填写 imageRegistryId 和 imageRepoId,保持为空即可。
使用第三方镜像时,需要填写以下三个字段:
imageRegistryId:平台中已配置好的第三方镜像 ID。
imageRepoId:该镜像在第三方仓库中对应的仓库项目 ID。
imageId:镜像的完整标签。
若有镜像自动保存失败的情况,数据库镜像 ID 不会更新。
建议先停止当前任务,隔离现有环境。
使用最近保存的镜像版本启动新开发机实例进行验证。
确认环境一致性后重新关联正确镜像即可。
其他情况需联系金山云技术支持工程师处理。
纯净模式
