最近更新时间:2025-11-28 13:56:32
星流平台模型API服务对主账号下每个模型设置限流标准,主账号下所有API Key、所有项目共享同一个模型级别限流。限流标准的单位为RPM(Request Per Minute)及TPM(Token Per Minute),当调用流量超过任一标准时将触发限流,API调用请求将失败,服务通常会在1分钟后解除限流条件并恢复。
模型厂商 | 模型名称 | RPM限流 | TPM限流 |
千问 | qwen3-coder-480b-a35b-instruct | 600 | 1,000,000 |
智谱AI | glm-4.6 | 3,000 | 1,000,000 |
OpenAI | gpt-oss-120b | 1,000 | 200,000 |
DeepSeek | deepseek-r1-0528 | 10,000 | 1,000,000 |
deepseek-v3-0324 | 10,000 | 1,000,000 | |
deepseek-v3.1 | 10,000 | 1,000,000 | |
deepseek-v3.2-exp | 1,000 | 150,000 | |
月之暗面 | kimi-k2-0905-preview | 1,000 | 400,000 |
kimi-k2-turbo-preview | 1,000 | 400,000 | |
kimi-k2-turbo-enterprise | 2,000 | 800,000 | |
kimi-k2-thinking | 1,000 | 400,000 | |
kimi-k2-thinking-turbo | 1,000 | 400,000 |
模型厂商 | 模型名称 | 限流 |
可灵AI | kling-v2-1-master | 10并发(单用户同时进行的任务数量) |
kling-v2-5-turbo | 10并发(单用户同时进行的任务数量) |
如您对限流标准有调整需要,请提出工单申请联系售后工程师进行调整。
纯净模式
