全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

星流平台(KSP)

最近更新时间:2026-02-10 17:34:10

星流平台(批量推理)

事件类型

事件名称

事件名称(中文)

事件等级

事件状态

事件说明

BatchJobStatusChange
(批量推理任务状态变更)

BatchJobFail

批量推理任务状态变更为失败

Warn

Failed

您的批量推理任务已失败,请及时查看并重新创建任务。

BatchJobComplete

批量推理任务状态变更为完成

Info

Completed

您的批量推理任务已完成,请及时查看结果。

BatchJobTerminate

批量推理任务状态变更为已终止

Info

Terminated

您的批量推理任务已终止,请及时查看结果。


星流平台(开发及训推任务)

事件类型

事件名称

事件名称(中文)

事件等级

事件状态

事件说明

NotebookStatusChange

(开发任务状态变更)

NotebookPending

开发任务因资源不足任务已经入排队状态

Info

Pending

开发任务因资源不足任务已经入排队状态

NotebookRunning

开发任务排队结束进入运行状态

Info

Running

开发任务排队结束进入运行状态

NotebookFailed

开发任务状态异常

Warn

Failed

开发任务状态异常

NotebookSubmitFailed

开发任务创建失败

Warn

SubmitFailed

开发任务创建失败

TrainJobStatusChange

(训练任务状态变更)

TrainJobPending

训练任务因资源不足任务已经入排队状态

Info

Pending

训练任务因资源不足任务已经入排队状态

TrainJobRunning

训练任务排队结束进入运行状态

Info

Running

训练任务排队结束进入运行状态

TrainJobFailed

训练任务已失败,请及时查看原因

Warn

Failed

训练任务已失败,请及时查看原因

TrainJobSucceed

训练任务成功,请及时查看及验收任务结果

Info

Succeed

训练任务成功,请及时查看及验收任务结果

InferenceStatusChange

(模型在线服务状态变更)

InferenceFailed

模型在线服务任务创建失败,请及时查看原因

Warn

Failed

模型在线服务任务创建失败,请及时查看原因

InferenceScaleFailed

模型在线服务扩缩容失败,请及时查看原因

Warn

ScaleFailed

模型在线服务扩缩容失败,请及时查看原因

InferenceConfigFailed

模型在线服务更新失败,请及时查看原因

Warn

ConfigFailed

模型在线服务更新失败,请及时查看原因

星流平台(Token用量监控)

事件类型

事件名称

事件名称(中文)

事件等级

事件状态

事件说明

TokenMonitor

(Token用量监控)

FreeQuotaMonitor

免费额度用量监控

Warn

-

免费额度用量到达50%、80%、90%、100%时,给出报警提醒

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈