最近更新时间:2026-06-01 10:44:14
用户在开通模型API服务后,平台会自动发放免费额度,每个文本模型及视觉理解模型额度为100万Tokens,视频生成及图片生成模型暂不提供免费额度。在免费额度消耗完后,继续使用模型API服务将产生计费,需保证账户内有足够余额,账户欠费后,即使其他模型有免费额度也无法进行API调用。
开通模型API调用服务不产生费用,调用大模型实现文本生成等推理任务时,会产生费用。计费方式为按Token消耗量后付费。
计费公式为 费用= 输入Token命中缓存数量×输入命中缓存单价+输入Token未命中缓存数量×输入未命中缓存单价+输出Token数量×输出单价(其中输出Token数量包含模型输出Token及深思考Token)。
账单出账周期为按小时结算,以平台实际出账时间为准。可在费用中心查看账单。
如需关闭计费,您在停止使用相关功能后将不再产生费用。您也可以在控制台-API Key管理页面对API Key进行禁用或删除防止产生意外调用费用。
联网搜索功能价格为30元/千次,网页解析功能价格为15元/千次。
上下文缓存功能默认开启。通过缓存常用上下文信息,为您减少每次请求时进行的重复处理开销。
您发送请求后,命中缓存的输入Token将按照较低的命中缓存输入价格结算,未命中缓存的输入Token按照正常输入价格结算。
模型厂商 | 模型 | 阶梯计费档位 | 上下文长度 | 未命中缓存输入价格(百万Token) | 批量推理未命中缓存输入价格(百万Token) | 命中缓存输入价格 (百万Token) | 命中显式缓存输入价格(百万Token) | 输出价格(百万Token) | 批量推理输出价格(百万Token) | 5min写入缓存价格(百万Token) |
Xiaomi | mimo-v2-omni | - | 256k | 2.80元 | - | 0.56元 | - | 14.00元 | - | - |
mimo-v2-pro | 输入长度(0, 256k] | 1M | 7元 | 3.5元 | 1.4元 | - | 21元 | 10.5元 | - | |
输入长度(256k, 1M] | 14元 | 7元 | 2.8元 | - | 42元 | 21元 | - | |||
mimo-v2-flash | - | 256k | 0.7元 | 0.35元 | 0.07元 | - | 2.1元 | 1.05元 | - | |
mimo-v2.5 | 输入长度[0,256K) | 1M | 2.8元 | - | 0.56元 | - | 14元 | - | - | |
输入长度[256K,1M) | 5.6元 | - | 1.12元 | - | 28元 | - | - | |||
mimo-v2.5-pro | 输入长度[0,256K) | 1M | 7元 | - | 1.4元 | - | 21元 | - | - | |
输入长度[256K,1M) | 14元 | - | 2.8元 | - | 42元 | - | - | |||
Minimax | minimax-m2.7 | - | 200k | 2.1元 | - | 0.42元 | - | 8.4元 | - | - |
minimax-m2.5 | - | 200k | 2.1元 | - | 0.21元 | - | 8.4元 | - | - | |
Qwen | qwen3.5-flash | 输入长度(0, 128k] | 1M | 0.2元 | - | 0.02元 | 0.02元 | 0.8元 | - | 0.1元 |
输入长度(128k, 256k] | 0.6元 | - | 0.06元 | 0.06元 | 2.4元 | - | 0.3元 | |||
输入长度(256k, 1M] | 1.2元 | - | 0.12元 | 0.12元 | 4.8元 | - | 0.6元 | |||
qwen3.5-397b-a17b | 输入长度(0, 128k] | 256k | 1.2元 | - | - | - | 7.2元 | - | - | |
输入长度(128k, 256k] | 3元 | - | - | - | 18元 | - | - | |||
qwen3.5-35b-a3b | 输入长度(0, 128k] | 256k | 0.4元 | - | - | - | 3.2元 | - | - | |
输入长度(128k, 256k] | 1.6元 | - | - | - | 12.8元 | - | - | |||
qwen3-max-2026-01-23 | 输入长度(0, 32k] | 256k | 2.5元 | - | - | - | 10元 | - | - | |
输入长度(32k, 128k] | 4元 | 16元 | ||||||||
输入长度(128k, 256k] | 7元 | 28元 | ||||||||
qwen3-30b-a3b-instruct-2507 | - | 128k | 0.75元 | - | - | - | 3元 | - | - | |
qwen-plus | 输入长度(0, 128k] | 1M | 0.8元 | - | 0.16元 | 0.08元 | 2元 | - | 1元 | |
输入长度(128k, 256k] | 2.4元 | 0.48元 | 0.24元 | 20元 | 3元 | |||||
输入长度(256k, 1M] | 4.8元 | 0.96元 | 0.48元 | 48元 | 6元 | |||||
qwen-flash | 输入长度(0, 128k] | 1M | 0.15元 | - | 0.03元 | 0.015元 | 1.5元 | - | 0.1875元 | |
输入长度(128k, 256k] | 0.6元 | 0.12元 | 0.06元 | 6元 | 0.75元 | |||||
输入长度(256k, 1M] | 1.2元 | 0.24元 | 0.12元 | 12元 | 1.5元 | |||||
qwen3-coder-480b-a35b-instruct | 输入长度(0, 32k] | 256k | 6元 | 3元 | 0.6元 | - | 24元 | 12元 | - | |
输入长度(32k, 128k] | 9元 | 4.5元 | 0.9元 | 36元 | 18元 | |||||
输入长度(128k, 256k] | 15元 | 7.5元 | 1.5元 | 60元 | 30元 | |||||
qwen3-235b-a22b-instruct-2507 | - | 128k | 2元 | 1元 | \ | - | 8元 | 4元 | - | |
qwen3-235b-a22b-thinking-2507 | - | 128k | 2元 | 1元 | \ | - | 20元 | 10元 | - | |
qwen3-coder-plus | 输入长度[0,32K) | 1M | 4元 | - | 0.8元 | - | 16元 | - | - | |
输入长度[32K,128K) | 6元 | - | 1.2元 | - | 24元 | - | - | |||
输入长度[128K,256K) | 10元 | - | 2元 | - | 40元 | - | - | |||
输入长度[256K,1M) | 20元 | - | 4元 | - | 200元 | - | - | |||
ZhipuAI | glm-4.6 | 输入长度[0, 32k],输出长度[0, 0.2k] | 200k | 2元 | 1元 | 0.4元 | - | 8元 | 4元 | - |
输入长度[0, 32k],输出长度[0.2k+] | 3元 | 1.5元 | 0.6元 | 14元 | 7元 | |||||
输入长度[32k, 200k] | 4元 | 2元 | 0.8元 | 16元 | 8元 | |||||
glm-4.7 | 输入长度[0, 32k],输出长度[0, 0.2k] | 200k | 2元 | 1元 | 0.4元 | - | 8元 | 4元 | - | |
-输入长度[0, 32k],输出长度[0.2k+] | 3元 | 1.5元 | 0.6元 | 14元 | 7元 | |||||
输入长度[32k, 200k] | 4元 | 2元 | 0.8元 | 16元 | 8元 | |||||
glm-5 | 输入长度[0, 32k] | 200k | 4元 | 2元 | 1元 | - | 18元 | 9元 | - | |
输入长度[32k, 200k] | 6元 | 3元 | 1.5元 | 22元 | 11元 | |||||
glm-5.1 | 输入长度[0, 32k] | 200k | 6元 | 3元 | 1.3元 | - | 24元 | 12元 | 7.5元 | |
输入长度[32k, 200k] | 8元 | 4元 | 2元 | 28元 | 14元 | 10元 | ||||
OpenAI | gpt-oss-120b | - | 128k | 1元 | 0.5元 | 0.5元 | - | 5元 | 2.5元 | - |
DeepSeek | deepseek-v3-0324 | - | 128k | 2元 | 1元 | 1元 | - | 8元 | 4元 | - |
deepseek-v3.1 | - | 128k | 4元 | 2元 | 2元 | - | 12元 | 6元 | - | |
deepseek-v3.2 | - | 128k | 2元 | 1元 | 0.2元 | - | 3元 | 1.5元 | - | |
deepseek-v4-flash | - | 1M | 1元 | - | 0.02元 | - | 2元 | - | - | |
deepseek-v4-pro | - | 1M | 12元 | 6元 | 0.1元 | - | 24元 | 12元 | - | |
月之暗面 | kimi-k2.5 | - | 256k | 4元 | - | 0.7元 | - | 21元 | - | - |
kimi-k2.6 | - | 262.1k | 6.5元 | - | 1.1元 | - | 27元 | - | - |
模型厂商 | 模型 | 模式 | 单价 |
可灵AI | kling-v3-omni | - | std品质x1s时长x无参考视频x无声: 0.6元; std品质x1s时长x无参考视频x有声: 0.8元; std品质x1s时长x有参考视频x无声: 0.9元; pro品质x1s时长x无参考视频x无声: 0.8元; pro品质x1s时长x无参考视频x有声: 1.0元; pro品质x1s时长x有参考视频x无声: 1.2元; |
kling-v2-1-master | - | 10元/5s | |
kling-v2-5-turbo | std | 1.5元/5s | |
pro | 2.5元/5s | ||
kling-v2-6 | - | 5s视频生成价格: std品质x无声x未指定音色:1.5元; pro品质x无声x未指定音色:2.5元; pro品质x有声x未指定音色:5元; pro品质x有声x指定音色:6元; std品质x动作控制:2.5元; pro品质x动作控制:4元; | |
kling-video-o1 | - | std品质x参考视频:4.5元/5s; pro品质x参考视频:6元/5s; std品质x无参考视频:3元/5s; pro品质x无参考视频:4元/5s; | |
kling-v3 | - | 视频生成(每秒): std品质x无声x未指定音色:0.6元; std品质x有声x未指定音色:0.9元; pro品质x无声x未指定音色:0.8元; pro品质x有声x未指定音色:1.2元; std品质x动作控制:0.9元; pro品质x动作控制:1.2元; | |
Qwen | wan-2.6-i2v | 720p | 3元/5s |
1080p | 5元/5s | ||
Minimax | hailuo-2.3-fast | 768p | 1.35元/6s |
2.25元/10s | |||
1080p | 2.31元/6s | ||
hailuo-2.3 | 768p | 2元/6s | |
4元/10s | |||
1080p | 3.5元/6s | ||
hailuo-02 | 512p | 0.6元/6s | |
1元/10s | |||
768p | 2元/6s | ||
4元/10s | |||
1080p | 3.5元/6s | ||
Vidu | viduq2-turbo | - | 0.03125元/积分 |
viduq2-pro-fast | - | 0.03125元/积分 | |
viduq2-pro | - | 0.03125元/积分 |
模型厂商 | 模型名称 | 阶梯计费档位 | 未命中缓存输入价格(百万Token)(在线推理输入) | 批量推理未命中缓存输入价格(百万Token)(批量推理输入) | 命中缓存输入价格 (百万Token)(在线/批量推理缓存命中) | 输出价格(百万Token)(在线推理输出) | 批量推理输出价格(百万Token)(批量推理输出) | 命中显式缓存(在线推理) | 5min写入缓存 |
腾讯 | hunyuan-t1-vision-20250916 | - | 3元 | - | - | 9元 | - | - | - |
hunyuan-vision-1.5-instruct | - | 3元 | - | - | 9元 | - | - | - | |
Qwen | qwen3-vl-235b-a22b-instruct | - | 2元 | 1元 | - | 8元 | 4元 | - | - |
qwen3-vl-235b-a22b-thinking | - | 2元 | 1元 | - | 20元 | 10元 | - | - | |
qwen3-vl-30b-a3b-instruct | - | 0.75元 | 0.375元 | - | 3元 | 1.5元 | - | - | |
qwen3-vl-plus | 输入长度[0,32k) | 1元 | - | 0.2元 | 10元 | - | 0.1元 | 1.25元 | |
输入长度[32k,128k) | 1.5元 | - | 0.3元 | 15元 | - | 0.15元 | 1.875元 | ||
输入长度[128k,256k) | 3元 | - | 0.6元 | 30元 | - | 0.3元 | 3.75元 | ||
qwen3-vl-flash | 输入长度[0,32k) | 0.15元 | - | 0.03元 | 1.5元 | - | - | - | |
输入长度[32k,128k) | 0.3元 | - | 0.06元 | 3元 | - | - | - | ||
输入长度[128k,256k) | 0.6元 | - | 0.3元 | 6元 | - | - | - |
模型厂商 | 模型名称 | 文生图单价/张 | 图生图单价/张 |
Qwen | wan2.6-t2i | 0.2元 | - |
豆包 | doubao-seedream-4.5 | 0.25元 | 0.25元 |
模型厂商 | 模型 | 输入单价 |
Qwen | qwen3-embedding-8b | 0.5元/百万Token |
qwen3-reranker-8b | 0.5元/千Token |
按量后付费账单每小时结算,账单产生后实时进行结算扣款。如您账户中余额及代金券之和小于待结算账单,您的账号会被视为欠费状态。
欠费5分钟后平台将暂停您主账号下所有模型、所有API Key的模型调用服务。
纯净模式
