最近更新时间:2026-04-01 11:56:53
模型用量监控功能,为您提供模型当前调用次数(搜索/解析)与Token消耗的统计视图,支持在在线/批量推理与在线体验两种统计维度上,按模型及自定义时间段筛选查询监控信息。
登录星流平台模型API服务控制台,在左侧导航栏,选择模型用量监控。
在用量监控页面,通过切换页签,您可查看全部、在线推理、批量推理或在线体验服务的Token用量、联网搜索和网页解析次数。
在输入 Token 数量统计区域,您可将鼠标移至输入 Token 量处查看详细数据,该数据分为命中缓存 Token 数量及未命中缓存 Token 数量。
同时您也可在本页面查询模型维度 Token 使用情况。
点击模型下拉框,选择相应的模型,您可查看自定义时间段内的监控信息。
纯净模式
