全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

模型限流

最近更新时间:2025-11-28 13:56:32

限流规则

星流平台模型API服务对主账号下每个模型设置限流标准,主账号下所有API Key、所有项目共享同一个模型级别限流。限流标准的单位为RPM(Request Per Minute)及TPM(Token Per Minute),当调用流量超过任一标准时将触发限流,API调用请求将失败,服务通常会在1分钟后解除限流条件并恢复。

模型限流

文本生成模型

模型厂商

模型名称

RPM限流

TPM限流

千问

qwen3-coder-480b-a35b-instruct

600

1,000,000

智谱AI

glm-4.6

3,000

1,000,000

OpenAI

gpt-oss-120b

1,000

200,000

DeepSeek

deepseek-r1-0528

10,000

1,000,000

deepseek-v3-0324

10,000

1,000,000

deepseek-v3.1

10,000

1,000,000

deepseek-v3.2-exp

1,000

150,000

月之暗面

kimi-k2-0905-preview

1,000

400,000

kimi-k2-turbo-preview

1,000

400,000

kimi-k2-turbo-enterprise

2,000

800,000

kimi-k2-thinking

1,000

400,000

kimi-k2-thinking-turbo

1,000

400,000

视觉模型

模型厂商

模型名称

限流

可灵AI

kling-v2-1-master

10并发(单用户同时进行的任务数量)

kling-v2-5-turbo

10并发(单用户同时进行的任务数量)

如您对限流标准有调整需要,请提出工单申请联系售后工程师进行调整。

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈