全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

模型用量监控

最近更新时间:2026-04-01 11:56:53

功能简述

模型用量监控功能,为您提供模型当前调用次数(搜索/解析)与Token消耗的统计视图,支持在在线/批量推理与在线体验两种统计维度上,按模型及自定义时间段筛选查询监控信息。

操作步骤

  1. 登录星流平台模型API服务控制台,在左侧导航栏,选择模型用量监控

  2. 在用量监控页面,通过切换页签,您可查看全部在线推理批量推理在线体验服务的Token用量、联网搜索和网页解析次数。

  3. 在输入 Token 数量统计区域,您可将鼠标移至输入 Token处查看详细数据,该数据分为命中缓存 Token 数量及未命中缓存 Token 数量。

    • 同时您也可在本页面查询模型维度 Token 使用情况。

  4. 点击模型下拉框,选择相应的模型,您可查看自定义时间段内的监控信息。

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈