最近更新时间:2026-03-03 17:29:36
知识库检索是星流平台为用户提供的核心验证能力,支持用户在已构建的知识库中,通过输入查询语句快速召回相关知识切片。该功能基于向量化检索技术,可精准匹配与查询意图相关的文档片段,直观展示检索结果的来源文档、切片内容与字符数,帮助用户验证知识库的召回准确性、优化分段策略,是保障 RAG 应用效果的关键前置环节。
登录星流平台控制台,进入目标知识库的详情页面,点击「知识库检索」标签页,进入检索操作界面。
在检索输入框中输入需要查询的问题或关键词(如 “EIP 的计费方式”),点击右侧的蓝色搜索按钮,发起检索请求。
系统将根据查询意图,召回与内容最相关的知识切片,并以卡片形式展示。每个结果卡片包含:
切片序号
切片核心内容预览
切片字符数
来源文档名称
用户可通过滚动浏览全部检索结果,快速评估召回的相关性与完整性。
若需深入查看某条检索结果的完整内容,点击对应结果卡片,系统将弹出切片详情弹窗。弹窗内会清晰展示:
归属文档名称
切片完整内容
切片字符数
知识库设置是星流平台为用户提供的检索策略精细化配置能力,支持对索引方式、检索逻辑、重排序模型等核心参数进行自定义,以适配不同业务场景下的检索效率与召回精度需求。通过该功能,用户可灵活调控检索召回的切片数量、相似度阈值及重排序策略,是优化 RAG 应用效果、提升知识匹配精准度的关键配置环节。
快速索引:文档处理速度快,适合上传文档数量较多且文档结构简单的场景,可提升大规模知识库的检索响应效率。
智能检索:基于图索引技术的智能检索方案,支持多路检索召回,适合对检索精度要求较高的场景。
向量检索
Top K:用于筛选与用户问题相似度最大的文本片段,系统会根据选用模型的上下文窗口大小动态调整分段数量。取值范围为 1–50,数值越大召回切片越多,可提升召回覆盖率,但会增加计算开销。
Score 阈值:用于设置文本片段筛选的相似度阈值,取值范围为 0–1。阈值越高,仅保留与查询高度相关的切片,可提升结果精准度;阈值越低,召回范围更广,可避免遗漏潜在相关内容。
倒排检索
Top K:与向量检索的 Top K 逻辑一致,用于控制倒排检索召回的切片数量,取值范围为 1–50。
Score 阈值:用于设置倒排检索片段的相似度阈值,取值范围为 0–1,可根据业务需求灵活调控召回精度。
Rerank 模型
开启后可选择指定的重排序模型(如 Qzhou/BGE-Reranker-v2-m3),对多路检索召回的结果进行二次排序,进一步提升 Top N 结果的相关性。
Top K:控制重排序后输出的切片数量,取值范围为 1–50。
Score 阈值:设置重排序后片段的筛选阈值,取值范围为 0–1,仅保留排序后得分高于阈值的切片。
上述参数选择完成之后,点击保存即可完成知识库的设置。
纯净模式
