最近更新时间:2026-03-03 17:29:36
新建空知识库是星流平台知识库管理的基础功能,支持用户创建一个无初始文档的空白知识库容器,用于后续按需添加文档、配置检索策略,满足企业级知识管理的灵活搭建需求。
进入新建入口
在知识库列表页面,点击顶部操作栏的「新建」按钮,在下拉菜单中选择「新建空知识库」选项,进入空知识库创建弹窗。
填写基础信息
在弹出的「新建空知识库」窗口中,完成以下信息配置:
名称:必填项,支持 1-40 个字符,可包含字母、中文、数字及-_、\/()等符号,用于唯一标识知识库。
描述:选填项,支持最多 200 个字符,用于补充说明知识库的业务场景、用途等信息,便于后续管理与协作。
确认创建
信息填写完成后,点击弹窗右下角的「确定」按钮,系统将自动创建空知识库并返回至知识库列表页面,新创建的空知识库卡片将展示在列表中,支持后续添加文档、召回测试等操作。
新建完整知识库是星流平台为用户提供的一站式知识构建能力,支持在创建知识库的同时,完成文档导入、解析方式配置、分段策略设置等全流程操作,帮助用户快速构建可直接用于检索增强生成(RAG)的企业级知识底座。
该功能支持导入常规类型文件(PDF、DOCX、TXT 等)与结构化文件(CSV、XLS 等),并提供多模态深度理解、智能分段与清洗等高级配置,确保知识解析精准、检索高效,同时支持自定义提示词,适配不同业务场景下的知识应用需求。
在知识库列表页面,点击顶部操作栏的「新建」按钮,在下拉菜单中选择「新建完整知识库」选项,进入三步式创建流程
在「基本信息」步骤中,完成以下配置:
名称:必填项,支持 1-40 个字符,可包含字母、中文、数字及-_、\/()等符号,用于唯一标识知识库。
描述:选填项,支持最多 200 个字符,用于补充说明知识库的业务场景、用途等信息。
填写完成后,点击「下一步:数据选择」进入文档导入环节。
在「数据选择」步骤中,根据文档类型选择对应导入方式:
导入常规类型文件:支持 PDF、DOC、DOCX、TXT、Markdown 等格式,单文件大小限制为 PDF 20MB、DOC 20MB、DOCX 20MB、TXT 5MB、MD 5MB,最多同时上传 100 个文件。
导入结构化文件:支持 CSV、JSONL、XLS、XLSX 等格式,单文件大小限制为 4MB,最多同时上传 1 个文件;XLS/XLSX/CSV 文件仅取第一个 sheet,且行数不超过 5000 行。
选择导入方式后,可将文件拖拽至上传区域,或点击上传区域选择本地文件完成导入。
常规型文件:
在「索引设置」步骤中,配置文档解析规则:
解析方式:支持「图片理解」、「表格理解」等多模态深度解析,可自定义 模型、SYSTEM 与 USER 提示词,适配表格、流程图等复杂内容的解析需求,确保文档信息提取精准。
提示词设置:可编辑 SYSTEM 角色定义与 USER 任务要求,例如指定图片解析为表格或流程图的判定规则,以及对应输出格式,提升解析结果的业务适配性。
在「索引设置」步骤中,选择分段规则:
智能分段与清洗:系统自动设置分段规则与预处理规则,适合对参数不熟悉的用户,无需手动配置。
标题分段与清洗:根据文档标题层级(如第一章、1.1)进行分段,适合格式规范、标题清晰的文档,可提升知识检索的上下文连贯性。
分隔符分段与清洗:
支持按换行符(\n\n)或自定义分隔符进行分段,适合结构清晰的文档,可实现更个性化的知识切片。
若选择「标题分段与清洗」,可配置分割最大长度(默认 1024 字符);若选择「分隔符分段与清洗」,可选择换行符或自定义分隔符。
结构化文件
配置表基础信息
上传完成后,进入表结构配置页面,完成以下基础信息设置:
表名称:必填项,自动填充为文件名,可自定义修改,用于标识结构化知识集合。
表描述:必填项,支持最多 200 个字符,用于说明表的业务场景、数据来源等信息。
配置表结构
在表结构配置区域,对每一列进行精细化设置:
列名:自动识别文件中的列标题,可根据业务需求修改。
描述:必填项,需输入 2 个字符以上的描述,说明该列的业务含义(如 “用户问题”“模型回答”“业务指标值”)。
数据类型:默认设置为text,支持根据数据特性调整,确保后续检索与应用的准确性。
操作:可删除冗余列,仅保留核心业务字段。
配置完成后,可点击「预览」按钮,查看表结构与数据样例,确保配置无误。
配置解析方式
在「索引设置」步骤中,针对结构化文件中的图片或内嵌表格,配置解析规则:
图片理解:使用多模态模型深度解析文档中的图片元素,可通过「提示词设置」自定义图片解析规则(如判定为表格 / 流程图、输出格式等)。
表格理解:使用多模态模型深度解析文档中的表格元素,可通过「提示词设置」自定义表格解析规则(如 Markdown 格式输出、字段映射等)。
两种解析方式可多选,适配包含图片与表格的复杂结构化文档。
设置分段策略
在「索引设置」步骤中,选择分段规则:
智能分段与清洗:系统自动设置分段规则与预处理规则,适合对参数不熟悉的用户,无需手动配置。
解析策略选择完之后,点击下一步,可设置知识库的相关参数:
索引方式
快速索引:文档处理速度快,适合上传文档数量较多且文档结构简单的场景,可提升大规模知识库的检索响应效率。
智能检索:基于图索引技术的智能检索方案,支持多路检索召回,适合对检索精度要求较高的场景。
检索设置
向量检索
Top K:用于筛选与用户问题相似度最大的文本片段,系统会根据选用模型的上下文窗口大小动态调整分段数量。取值范围为 1–50,数值越大召回切片越多,可提升召回覆盖率,但会增加计算开销。
Score 阈值:用于设置文本片段筛选的相似度阈值,取值范围为 0–1。阈值越高,仅保留与查询高度相关的切片,可提升结果精准度;阈值越低,召回范围更广,可避免遗漏潜在相关内容。
倒排检索
Top K:与向量检索的 Top K 逻辑一致,用于控制倒排检索召回的切片数量,取值范围为 1–50。
Score 阈值:用于设置倒排检索片段的相似度阈值,取值范围为 0–1,可根据业务需求灵活调控召回精度。
Rerank 模型
开启后可选择指定的重排序模型(如 Qzhou/BGE-Reranker-v2-m3),对多路检索召回的结果进行二次排序,进一步提升 Top N 结果的相关性。
Top K:控制重排序后输出的切片数量,取值范围为 1–50。
Score 阈值:设置重排序后片段的筛选阈值,取值范围为 0–1,仅保留排序后得分高于阈值的切片。
上述参数选择完成之后,点击保存即可完成知识库的设置。
修改知识库名称和描述
入口1:知识库实例页面-鼠标悬浮卡片右下角【...】-点击编辑
入口2:知识库详细界面-左上角-编辑按钮
删除知识库内的所有内容
单次删除-鼠标悬浮卡片-点击删除
点击【删除】确认删除成功
批量删除-点击左上角的批量操作-勾选需要删除的知识库卡片-点击左上角的删除按钮
点击删除即可删除成功
纯净模式
