金山云-文档中心-模型API服务简介

星流平台

查看更多结果

未找到含当前关键字的文档标题

页面目录

全部展开全部收起

产品更新动态

未找到含该关键词的产品

文档中心

星流平台

模型API服务

模型API服务简介

最近更新时间：2026-02-25 17:23:44



功能总览

API Key管理

生成与管理 API Key：用户可在控制台创建、管理 API Key，用于调用模型服务，支持启用/禁用操作，保障安全性。
权限控制：API Key 可关联特定模型或所属项目，确保不同业务使用不同的权限范围。

模型体验

在模型在线试用界面，您可以Chat形式试用模型广场中的文本模型并对某些参数进行便捷调整，评估模型性能，找到最适合业务场景的模型。在请求完成后您可查看调用的TTFT、TPOT等参数，评估模型效果。

模型广场

模型浏览：展示所有模型API服务已支持模型、分类标签、简介、版本的更新时间。
模型详情：展示对应模型所有可使用的API Key，并支持一键生成RestAPI及OpenAI SDK调用代码。

模型列表

文本生成模型

模型厂商	模型名称	简介	最大上下文长度
Minimax	minimax-m2.5	MiniMax-M2.5 聚焦于多语言编程和办公场景，专为高效编码与 Agent 工作流而生。	200k
Xiaomi	mimo-v2-flash	小米专为推理效率自研的总参数 309B（激活15B）的 MoE 模型，通过引入 Hybrid 注意力架构创新及多层 MTP 推理加速，在多个 Agent 测评基准上进入全球开源模型 Top 2	256k
Qwen	qwen3-max-2026-01-23	Qwen 体系中的旗舰级综合能力模型，面向复杂推理、多工具协同与企业级应用场景，提供高稳定性与高任务完成能力。	256k
	qwen3-30b-a3b-instruct-2507	基于Qwen3的非思考模式开源模型，相较上一版本中英文和多语言整体通用能力有大幅提升。主观开放类任务专项优化，显著更加符合用户偏好，能够提供更有帮助性的回复。	128k
	qwen-plus	Qwen3系列Plus模型，实现思考模式和非思考模式的有效融合，可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-Plus，达到同规模业界SOTA水平。	1M
	qwen-flash	Qwen3系列Flash模型，实现思考模式和非思考模式的有效融合，可在对话中切换模式。复杂推理类任务性能较强，指令遵循、文本理解等能力显著提高。	1M
	qwen3-coder-480b-a35b-instruct	Qwen3-Coder-480B-A35B-Instruct 是 Qwen 团队推出的编码专用模型。可处理仓库规模的代码理解任务，尤其在代理式编码、工具调用场景中表现出色。	256k
	qwen3-235b-a22b-thinking-2507	Qwen3 系列中面向高难度推理任务的思考型旗舰模型，强化多步逻辑、数学与编程能力，适合需要可解释、长链路推理的复杂场景。	128k
	qwen3-235b-a22b-instruct-2507	Qwen3 系列的 MoE 指令型旗舰模型，在 235B 总参数与约 22B 激活参数的架构下，提供高遵从性、稳定且可控的指令式输出，适合生产级应用。	128k
ZhipuAI	glm-4.6	GLM-4.6总参数量 355B，激活参数 32B，上下文提升至 200K，8 项基准全面提升。在编程、推理、搜索、写作、智能体应用等核心能力均完成对 GLM-4.5 的超越。	200k
	glm-4.7	GLM-4.7 面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同，并在多个公开基准的当期榜单中取得开源模型中的良好表现。	200k
	glm-5	GLM-5 是新一代的旗舰基座模型，面向 Agentic Engineering 打造，能够在复杂系统工程与长程 Agent 任务中提供可靠生产力。	200k
OpenAI	gpt-oss-120b	OpenAI 推出的开源权重模型，专为强大的推理能力、代理任务以及多样化的开发者场景而设计。	128k
DeepSeek	deepseek-r1-0528	DeepSeek Reasoner，专注逻辑推理、数学与编码任务，采用Dense架构和强化学习优化，参数规模约 671 B，支持高精推理输出。	128k
	deepseek-r1-0528		128k
	deepseek-v3-0324	DeepSeek Chat，作为更通用的一代模型，在对话、创意生成与指令遵循方面表现优异。使用 MoE 架构提高效率，参数与推理特性侧重全面性与部署效率。	128k
	deepseek-v3-0324		128k
	deepseek-v3.1	延续 DeepSeek-V3 架构风格，扩展上下文长度，支持混合推理架构，提供了更高的思考效率以及更强的Agent能力。	128k
	deepseek-v3.1		128k
	deepseek-v3.2-exp	作为迈向新一代架构的中间步骤，deepseek-v3.2-exp 在 v3.1-terminus 的基础上引入了 DeepSeek Sparse Attention（一种稀疏注意力机制），针对长文本的训练和推理效率进行了探索性的优化和验证。	128k
	deepseek-v3.2	作为迈向新一代架构的中间步骤，deepseek-v3.2-exp 在 v3.1-terminus 的基础上引入了 DeepSeek Sparse Attention（一种稀疏注意力机制），针对长文本的训练和推理效率进行了探索性的优化和验证。	128k
月之暗面	kimi-k2-0905-preview	Kimi-K2-0905-Preview 激活参数约 32B，总参数 1T，支持 256K Token 的长上下文输入，是对先前 128K 上下文的升级。它在代码生成、Agent 工具调用等任务上性能进一步提升，尤其在 SWE-Bench、LiveCodeBench 等基准上表现优异。	256k
	kimi-k2-turbo-preview	Kimi-K2-Turbo-Preview 是基于 Kimi K2 的高速版本，主要面向对响应速度和交互体验要求高的场景。该版本在保持 MoE 架构和大模型能力的同时，将输出速度提升了数倍，并在调用成本上做出优化，以降低用户使用门槛。	256k
	kimi-k2-turbo-enterprise	kimi-k2-turbo-enterprise是kimi-k2-turbo-preview模型的企业版接口版本，在价格、限流上做出区别。	256k
	kimi-k2-thinking	月之暗面提供的具有通用 Agentic 能力和推理能力的思考模型，它擅长深度推理，并可通过多步工具调用，帮助解决各类难题。	256k
	kimi-k2-thinking-turbo	是 kimi-k2-thinking 模型的高速版，适用于需要深度推理和追求高速的场景。	256k
	kimi-k2.5	Kimi K2.5在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。同时具备原生的多模态架构设计，同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。	256k

视频生成模型

模型厂商	模型名称	简介
可灵AI	kling-v2-1-master	快手 Kling AI 推出的高端视频生成模型，支持文字或图像生成短视频，在时空注意力、镜头稳定性和角色动态建模上显著提升，能更精准还原提示内容。
可灵AI	kling-v2-5-turbo	快手 Kling AI 推出的旗舰视频生成模型，支持文字或图像生成高清短视频，具备更高的提示理解力、更流畅的镜头运动和更稳定的画面风格。
Qwen	wan-2.6-i2v	通义 Wan 系列的图生视频模型，可将静态图像转化为连贯、自然运动的视频内容，适合创意生成与视觉内容制作场景。

视觉理解模型

模型厂商	模型名称	简介	最大上下文长度
Qwen	qwen3-vl-235b-a22b-instruct	针对用户指令优化的大型视觉—语言模型，侧重可靠遵从性与可控输出，适合需要明确、简洁且按指令格式化回答的应用场景。	128k
	qwen3-vl-235b-a22b-thinking	面向复杂视觉＋语言推理场景的大型多模态模型，强化了“深度思考/链式推理”能力，擅长从图像与文本联合输入中做出连贯、分步的解释与结论。	128k
	qwen3-vl-30b-a3b-instruct	经过指令优化的 30B 级多模态模型，能够对图像与文本进行稳健理解并生成高度可控、清晰且格式化的指令遵从型回答，适用于应用端的视觉问答与通用多模态交互。	128k

图片生成模型

模型厂商	模型名称	简介
Qwen	wan2.6-t2i	通义 Wan 系列的文生图模型，基于扩散生成架构，擅长理解中文提示词并生成高质量、多风格图像内容，适合设计与创意生产场景。

批量推理

批量推理功能支持您上传大量无需即时响应的请求，平台在有空闲资源时会对您的请求进行处理。

额度及开通管理

免费额度查看及管理：可查看免费额度以及对免费额度进行管理，可开启“免费额度用尽自动禁用”功能。
模型开通：可进行模型的批量开通，模型进行开通后才可进行调用。

流量监控

支持查询账号及模型维度消耗Token数量，评估成本与效果。

敏感词检测

模型API服务在模型自身能力基础之上，提供进一步的输入输出敏感词拦截，当检测到输入或输出包含敏感词时，将进行拦截以保障生成的内容安全。

联网搜索

联网搜索服务对主账号维度默认限流为5QPS，如您希望修改限额，请提出工单申请联系售后工程师。

文档导读

上一篇：模型API服务

下一篇：平台计费

纯净模式常规模式

纯净模式

点击可全屏预览文档内容