全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

知识库实例管理

最近更新时间:2026-03-03 17:29:36

创建空的知识库

功能简述

新建空知识库是星流平台知识库管理的基础功能,支持用户创建一个无初始文档的空白知识库容器,用于后续按需添加文档、配置检索策略,满足企业级知识管理的灵活搭建需求。

操作步骤

  • 进入新建入口

在知识库列表页面,点击顶部操作栏的「新建」按钮,在下拉菜单中选择「新建空知识库」选项,进入空知识库创建弹窗。

  • 填写基础信息

在弹出的「新建空知识库」窗口中,完成以下信息配置:

  • 名称:必填项,支持 1-40 个字符,可包含字母、中文、数字及-_、\/()等符号,用于唯一标识知识库。

  • 描述:选填项,支持最多 200 个字符,用于补充说明知识库的业务场景、用途等信息,便于后续管理与协作。

  • 确认创建

信息填写完成后,点击弹窗右下角的「确定」按钮,系统将自动创建空知识库并返回至知识库列表页面,新创建的空知识库卡片将展示在列表中,支持后续添加文档、召回测试等操作。

创建完整知识库

功能简述

新建完整知识库是星流平台为用户提供的一站式知识构建能力,支持在创建知识库的同时,完成文档导入、解析方式配置、分段策略设置等全流程操作,帮助用户快速构建可直接用于检索增强生成(RAG)的企业级知识底座。

该功能支持导入常规类型文件(PDF、DOCX、TXT 等)与结构化文件(CSV、XLS 等),并提供多模态深度理解、智能分段与清洗等高级配置,确保知识解析精准、检索高效,同时支持自定义提示词,适配不同业务场景下的知识应用需求。

操作步骤

进入新建入口

在知识库列表页面,点击顶部操作栏的「新建」按钮,在下拉菜单中选择「新建完整知识库」选项,进入三步式创建流程

填写基本信息

在「基本信息」步骤中,完成以下配置:

  • 名称:必填项,支持 1-40 个字符,可包含字母、中文、数字及-_、\/()等符号,用于唯一标识知识库。

  • 描述:选填项,支持最多 200 个字符,用于补充说明知识库的业务场景、用途等信息。

填写完成后,点击「下一步:数据选择」进入文档导入环节。

选择数据源并上传文件

在「数据选择」步骤中,根据文档类型选择对应导入方式:

  • 导入常规类型文件:支持 PDF、DOC、DOCX、TXT、Markdown 等格式,单文件大小限制为 PDF 20MB、DOC 20MB、DOCX 20MB、TXT 5MB、MD 5MB,最多同时上传 100 个文件。

  • 导入结构化文件:支持 CSV、JSONL、XLS、XLSX 等格式,单文件大小限制为 4MB,最多同时上传 1 个文件;XLS/XLSX/CSV 文件仅取第一个 sheet,且行数不超过 5000 行。

选择导入方式后,可将文件拖拽至上传区域,或点击上传区域选择本地文件完成导入。

解析策略的选取与分段策略

常规型文件:

在「索引设置」步骤中,配置文档解析规则:

  • 解析方式:支持「图片理解」、「表格理解」等多模态深度解析,可自定义 模型、SYSTEM 与 USER 提示词,适配表格、流程图等复杂内容的解析需求,确保文档信息提取精准。

  • 提示词设置:可编辑 SYSTEM 角色定义与 USER 任务要求,例如指定图片解析为表格或流程图的判定规则,以及对应输出格式,提升解析结果的业务适配性。

在「索引设置」步骤中,选择分段规则:

  • 智能分段与清洗:系统自动设置分段规则与预处理规则,适合对参数不熟悉的用户,无需手动配置。

  • 标题分段与清洗:根据文档标题层级(如第一章、1.1)进行分段,适合格式规范、标题清晰的文档,可提升知识检索的上下文连贯性。

  • 分隔符分段与清洗

支持按换行符(\n\n)或自定义分隔符进行分段,适合结构清晰的文档,可实现更个性化的知识切片。

若选择「标题分段与清洗」,可配置分割最大长度(默认 1024 字符);若选择「分隔符分段与清洗」,可选择换行符或自定义分隔符。

结构化文件

  • 配置表基础信息

上传完成后,进入表结构配置页面,完成以下基础信息设置:

  • 表名称:必填项,自动填充为文件名,可自定义修改,用于标识结构化知识集合。

  • 表描述:必填项,支持最多 200 个字符,用于说明表的业务场景、数据来源等信息。

  • 配置表结构

在表结构配置区域,对每一列进行精细化设置:

  • 列名:自动识别文件中的列标题,可根据业务需求修改。

  • 描述:必填项,需输入 2 个字符以上的描述,说明该列的业务含义(如 “用户问题”“模型回答”“业务指标值”)。

  • 数据类型:默认设置为text,支持根据数据特性调整,确保后续检索与应用的准确性。

  • 操作:可删除冗余列,仅保留核心业务字段。

配置完成后,可点击「预览」按钮,查看表结构与数据样例,确保配置无误。

  • 配置解析方式

在「索引设置」步骤中,针对结构化文件中的图片或内嵌表格,配置解析规则:

  • 图片理解:使用多模态模型深度解析文档中的图片元素,可通过「提示词设置」自定义图片解析规则(如判定为表格 / 流程图、输出格式等)。

  • 表格理解:使用多模态模型深度解析文档中的表格元素,可通过「提示词设置」自定义表格解析规则(如 Markdown 格式输出、字段映射等)。

两种解析方式可多选,适配包含图片与表格的复杂结构化文档。

  • 设置分段策略

在「索引设置」步骤中,选择分段规则:

  • 智能分段与清洗:系统自动设置分段规则与预处理规则,适合对参数不熟悉的用户,无需手动配置。

知识库设置

解析策略选择完之后,点击下一步,可设置知识库的相关参数:

索引方式

  • 快速索引:文档处理速度快,适合上传文档数量较多且文档结构简单的场景,可提升大规模知识库的检索响应效率。

  • 智能检索:基于图索引技术的智能检索方案,支持多路检索召回,适合对检索精度要求较高的场景。

检索设置

向量检索

  • Top K:用于筛选与用户问题相似度最大的文本片段,系统会根据选用模型的上下文窗口大小动态调整分段数量。取值范围为 1–50,数值越大召回切片越多,可提升召回覆盖率,但会增加计算开销。

  • Score 阈值:用于设置文本片段筛选的相似度阈值,取值范围为 0–1。阈值越高,仅保留与查询高度相关的切片,可提升结果精准度;阈值越低,召回范围更广,可避免遗漏潜在相关内容。

倒排检索

  • Top K:与向量检索的 Top K 逻辑一致,用于控制倒排检索召回的切片数量,取值范围为 1–50

  • Score 阈值:用于设置倒排检索片段的相似度阈值,取值范围为 0–1,可根据业务需求灵活调控召回精度。

Rerank 模型

  • 开启后可选择指定的重排序模型(如 Qzhou/BGE-Reranker-v2-m3),对多路检索召回的结果进行二次排序,进一步提升 Top N 结果的相关性。

  • Top K:控制重排序后输出的切片数量,取值范围为 1–50

  • Score 阈值:设置重排序后片段的筛选阈值,取值范围为 0–1,仅保留排序后得分高于阈值的切片。

上述参数选择完成之后,点击保存即可完成知识库的设置

编辑知识库名称和描述

功能简述

修改知识库名称和描述

操作步骤

入口1:知识库实例页面-鼠标悬浮卡片右下角【...】-点击编辑

入口2:知识库详细界面-左上角-编辑按钮

删除知识库

功能简述

删除知识库内的所有内容

操作步骤

单次删除-鼠标悬浮卡片-点击删除

点击【删除】确认删除成功

批量删除-点击左上角的批量操作-勾选需要删除的知识库卡片-点击左上角的删除按钮

点击删除即可删除成功

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈