最近更新时间:2026-06-01 10:44:14
生成与管理 API Key:用户可在控制台创建、管理 API Key,用于调用模型服务,支持启用/禁用操作,保障安全性。
权限控制:API Key 可关联特定模型或所属项目,确保不同业务使用不同的权限范围。
在模型在线试用界面,您可以Chat形式试用模型广场中的文本模型并对某些参数进行便捷调整,评估模型性能,找到最适合业务场景的模型。在请求完成后您可查看调用的TTFT、TPOT等参数,评估模型效果。
模型浏览:展示所有模型API服务已支持模型、分类标签、简介、版本的更新时间。
模型详情:展示对应模型所有可使用的API Key,并支持一键生成RestAPI及OpenAI SDK调用代码。
模型厂商 | 模型名称 | 简介 | 最大上下文长度 |
Minimax | minimax-m2.7 | M2.7是M2系列深度参与自身进化的模型,能够构建复杂Agent框架并通过Agent Teams、复杂Skills和动态工具搜索完成高度精细的生产力任务。 | 200k |
minimax-m2.5 | MiniMax-M2.5 聚焦于多语言编程和办公场景,专为高效编码与 Agent 工作流而生。 | 200k | |
Xiaomi | mimo-v2-omni | 统一文本、视觉与语音能力的全模态基础模型,支持复杂任务规划与工具调用,具备跨模态理解与执行能力,适用于智能体与复杂交互场景。 | 256k |
mimo-v2-flash | 小米专为推理效率自研的总参数 309B(激活15B)的 MoE 模型,通过引入 Hybrid 注意力架构创新 及 多层 MTP 推理加速,在多个 Agent 测评基准上进入全球开源模型 Top 2 | 256k | |
mimo-v2-Pro | Xiaomi MiMo-V2-Pro 专为现实世界中高强度的 Agent 工作场景而打造 | 1M | |
mimo-v2.5 | MiMo-V2.5是小米新一代多模态大模型,支持文本、图像等多模态理解与生成,具备更强推理能力与响应速度,适qwen3-coder-plus用于多场景智能应用部署。 | 1M | |
mimo-v2.5-pro | MiMo-V2.5-Pro具备智能体与复杂任务处理能力,支持长程多轮工具调用,指令理解与逻辑一致性显著提升,可胜任高复杂度专业应用场景。 | 1M | |
Qwen | qwen3.5-flash | 轻量高效的通用大模型,兼顾速度与成本优势,支持长上下文与多场景推理能力,适用于对话生成、内容创作及高频调用等业务场景。 | 1M |
qwen3.5-397b-a17b | Qwen新一代大规模多模态模型,具备视觉理解与复杂推理能力,在代码、Agent与视频理解等任务中表现优异,适用于高要求智能应用场景。 | 256k | |
qwen3.5-35b-a3b | Qwen3.5在多模态学习、架构效率、强化学习规模和全球可及性方面实现重大突破。在推理、编码、Agent和视觉理解基准上超越上代Qwen3-VL。 | 256k | |
qwen3-max-2026-01-23 | Qwen 体系中的旗舰级综合能力模型,面向复杂推理、多工具协同与企业级应用场景,提供高稳定性与高任务完成能力。 | 256k | |
qwen3-30b-a3b-instruct-2507 | 基于Qwen3的非思考模式开源模型,相较上一版本中英文和多语言整体通用能力有大幅提升。主观开放类任务专项优化,显著更加符合用户偏好,能够提供更有帮助性的回复。 | 128k | |
qwen-plus | Qwen3系列Plus模型,实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-Plus,达到同规模业界SOTA水平。 | 1M | |
qwen-flash | Qwen3系列Flash模型,实现思考模式和非思考模式的有效融合,可在对话中切换模式。复杂推理类任务性能较强,指令遵循、文本理解等能力显著提高。 | 1M | |
qwen3-coder-480b-a35b-instruct | Qwen3-Coder-480B-A35B-Instruct 是 Qwen 团队推出的编码专用模型。可处理仓库规模的代码理解任务,尤其在代理式编码、工具调用场景中表现出色。 | 256k | |
qwen3-235b-a22b-thinking-2507 | Qwen3 系列中面向高难度推理任务的思考型旗舰模型,强化多步逻辑、数学与编程能力,适合需要可解释、长链路推理的复杂场景。 | 128k | |
qwen3-235b-a22b-instruct-2507 | Qwen3 系列的 MoE 指令型旗舰模型,在 235B 总参数与约 22B 激活参数的架构下,提供高遵从性、稳定且可控的指令式输出,适合生产级应用。 | 128k | |
qwen3-coder-plus | Qwen3-Coder-Plus是面向软件开发优化的大模型,具备强代码生成与理解能力,支持多语言编程与复杂任务辅助开发 | 1M | |
ZhipuAI | glm-4.6 | GLM-4.6总参数量 355B,激活参数 32B,上下文提升至 200K,8 项基准全面提升。在编程、推理、搜索、写作、智能体应用等核心能力均完成对 GLM-4.5 的超越。 | 200k |
glm-4.7 | GLM-4.7 面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中取得开源模型中的良好表现。 | 128k | |
glm-5 | GLM-5 是新一代的旗舰基座模型,面向 Agentic Engineering 打造,能够在复杂系统工程与长程 Agent 任务中提供可靠生产力。 | 200k | |
glm-5.1 | GLM-5.1 是一个面向长程任务(Long Horizon Task)设计的模型。能够在一次任务中独立、持续地工作长达8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。 | 200k | |
OpenAI | gpt-oss-120b | OpenAI 推出的开源权重模型,专为强大的推理能力、代理任务以及多样化的开发者场景而设计。 | 128k |
DeepSeek | deepseek-v4-pro | DeepSeek-V4-Pro具备百万字上下文,Agent表现显著提升,世界知识与代码能力较强,综合性能比肩主流闭源模型。 | 1M |
deepseek-v4-flash | DeepSeek-V4-Flash拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均比较优异。兼顾高效与低成本,适用于高并发与实时场景,提供更快、更经济的API服务。 | 1M | |
deepseek-v3-0324 | DeepSeek Chat,作为更通用的一代模型,在对话、创意生成与指令遵循方面表现优异。使用 MoE 架构提高效率,参数与推理特性侧重全面性与部署效率。 | 128k | |
deepseek-v3.1 | 延续 DeepSeek-V3 架构风格,扩展上下文长度,支持混合推理架构,提供了更高的思考效率以及更强的Agent能力。 | 128k | |
deepseek-v3.2 | 作为迈向新一代架构的中间步骤,deepseek-v3.2-exp 在 v3.1-terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。 | 128k | |
月之暗面 | kimi-k2.5 | Kimi K2.5在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。同时具备原生的多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。 | 256k |
kimi-k2.6 | Kimi K2.6的通用Agent、代码、视觉理解等综合能力相比前代得到全面提升。同时支持文本、图片与视频输入,思考与非思考模式,对话与 Agent 任务。 | 262.1k |
模型厂商 | 模型名称 | 简介 |
可灵AI | kling-v3-omni | 新一代视频生成模型,支持高一致性画面生成与音画同步能力,在角色稳定性与动作表达上表现突出,适用于创意内容与影视级生成场景。 |
kling-v2-1-master | 快手 Kling AI 推出的高端视频生成模型,支持文字或图像生成短视频,在时空注意力、镜头稳定性和角色动态建模上显著提升,能更精准还原提示内容。 | |
kling-v2-5-turbo | 快手 Kling AI 推出的旗舰视频生成模型,支持文字或图像生成高清短视频,具备更高的提示理解力、更流畅的镜头运动和更稳定的画面风格。 | |
kling-v2-6 | Kling 2 系列的最新视频生成模型版本,进一步提升画面质量与运动连贯性,适合高要求的创意与商业视频生成场景。 | |
kling-video-o1 | Kling 视频模型中的高端创作取向版本,面向复杂镜头、电影化表达与高一致性视频生成需求,适合专业级内容制作。 | |
kling-v3 | Kling-V3是新一代视频生成大模型,支持高质量视频和图片生成与多模态输入,具备更强画面一致性与动态表现能力,适用于内容创作与商业级视频生产场景。 | |
Qwen | wan-2.6-i2v | 通义 Wan 系列的图生视频模型,可将静态图像转化为连贯、自然运动的视频内容,适合创意生成与视觉内容制作场景。 |
Minimax | hailuo-2.3-fast | Hailuo 2.3 的高速版本,在保持较好画质的同时显著降低生成延迟,更适合实时生成与高并发调用场景。 |
hailuo-2.3 | Hailuo 2.3 版本在画质与运动连贯性方面进一步提升,支持更复杂场景与镜头表达,适合商业化视频内容生产。 | |
hailuo-02 | Hailuo 早期高质量视频生成模型版本,具备较强的画面真实度与时序建模能力,适合创意视频与视觉内容生成场景。 | |
Vidu | viduq2-turbo | Vidu Q2 系列的高速版本,主打更低生成延迟与更高吞吐能力,适合实时预览、批量生成及对响应速度敏感的场景。 |
viduq2-pro-fast | 在 Pro 画质能力基础上进行速度优化的版本,在保持较高画质的同时降低生成时间,适合需要质量与效率平衡的应用场景。 | |
viduq2-pro | Vidu Q2 系列的高质量版本,在画面细节、运动连贯性和场景复杂度处理上表现更优,适合商业内容与创意视频制作。 |
模型厂商 | 模型名称 | 简介 | 最大上下文长度 |
腾讯 | hunyuan-t1-vision-20250916 | 混元最新版T1-Vision视觉深度思考模型,在通用图文问答、视觉定位、OCR、图表、拍题解题、看图创作等任务上全面提升,显著优化了英文和小语种能力。 | 28k |
hunyuan-vision-1.5-instruct | Hunyuan-Vision-1.5是一款基于Mamba-Transformer混合架构的视觉语言模型,提供先进的多语言多模态理解与推理能力。擅长图像与视频识别、OCR、图表理解,以及视觉推理和3D空间理解等高级任务。 | 24k | |
Qwen | qwen3-vl-235b-a22b-instruct | 针对用户指令优化的大型视觉—语言模型,侧重可靠遵从性与可控输出,适合需要明确、简洁且按指令格式化回答的应用场景。 | 128k |
qwen3-vl-235b-a22b-thinking | 面向复杂视觉+语言推理场景的大型多模态模型,强化了“深度思考/链式推理”能力,擅长从图像与文本联合输入中做出连贯、分步的解释与结论。 | 128k | |
qwen3-vl-30b-a3b-instruct | 经过指令优化的 30B 级多模态模型,能够对图像与文本进行稳健理解并生成高度可控、清晰且格式化的指令遵从型回答,适用于应用端的视觉问答与通用多模态交互。 | 128k | |
qwen3-vl-plus | Qwen3-VL-Plus 是通义千问的增强版视觉语言模型,擅长图像理解、视觉问答与文档解析,在中文视觉理解和复杂场景推理方面表现突出。 | 128k | |
qwen3-vl-flash | Qwen3系列小尺寸视觉理解模型,实现思考模式和非思考模式的有效融合,支持长视频长文档等超长上下文、空间感知与万物识别;具备视觉2D/3D定位能力,胜任复杂现实任务。 | 256k |
模型厂商 | 模型名称 | 简介 |
Qwen | wan2.6-t2i | 通义 Wan 系列的文生图模型,基于扩散生成架构,擅长理解中文提示词并生成高质量、多风格图像内容,适合设计与创意生产场景。 |
豆包 | doubao-seedream-4.5 | 豆包旗下的高质量图像生成模型,擅长精准理解中文提示词并生成写实、风格稳定的图像内容,适用于设计、营销与商业创意场景。 |
模型厂商 | 模型名称 | 简介 | 最大上下文长度 |
Qwen | qwen3-embedding-8b | qwen3-embedding-8b是专门用于生成高质量文本向量的 8B 参数级嵌入模型,用于搜索、相似度、RAG 等语义任务。 | 32k |
qwen3-reranker-8b | qwen3-reranker-8b是专门用于重排序的 8B 参数模型,可对候选文档进行精准相关性评分。在搜索、RAG、推荐等场景中,可显著提升检索结果的排序质量。 | 32k |
批量推理功能支持您上传大量无需即时响应的请求,平台在有空闲资源时会对您的请求进行处理。
免费额度查看及管理:可查看免费额度以及对免费额度进行管理,可开启“免费额度用尽自动禁用”功能。
模型开通:可进行模型的批量开通,模型进行开通后才可进行调用。
支持查询账号及模型维度消耗Token数量,评估成本与效果。
模型API服务在模型自身能力基础之上,提供进一步的输入输出敏感词拦截,当检测到输入或输出包含敏感词时,将进行拦截以保障生成的内容安全。
联网搜索服务对主账号维度默认限流为5QPS,如您希望修改限额,请提出工单申请联系售后工程师。
纯净模式
