全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

知识库实例管理

最近更新时间:2026-06-01 10:44:09

功能简述

星流平台为您提供两种知识库创建方式,您可根据需要选择任意一种。

  • 新建完整知识库:该方式为您提供的一站式知识构建能力,支持在创建知识库的同时,完成文档导入、解析方式配置、分段策略设置等全流程操作,帮助用户快速构建可直接用于检索增强生成(RAG)的企业级知识底座。该功能支持导入常规类型文件(PDF、DOCX、TXT 等)与结构化文件(CSV、XLS 等),并提供多模态深度理解、智能分段与清洗等高级配置,确保知识解析精准、检索高效,同时支持自定义提示词,适配不同业务场景下的知识应用需求。

  • 新建空知识库:该方式是星流平台知识库管理的基础功能,支持用户创建一个无初始文档的空白知识库容器,用于后续按需添加文档配置检索策略,满足企业级知识管理的灵活搭建需求。

前提条件

创建完整知识库

步骤一:设置基本信息

  1. 登录星流平台,在顶部导航栏,选择模型应用服务 > 知识库

  2. 在知识库列表页面,点击+新建,在下拉菜单中选择新建完整知识库选项,进入三步式创建流程

  3. 基本信息 步骤中,完成以下配置。

    参数

    是否必须

    说明

    名称

    当前知识库的名称,支持 1–40 个字符,可包含字母、中文、数字及 -_、/() 等符号,用于唯一标识知识库

    描述

    支持最多 200 个字符,用于补充说明知识库的业务场景、用途等信息

  4. 填写完成后,点击 下一步:数据选择 进入文档导入环节。

步骤二:数据选择与解析

  1. 数据选择步骤中,参考以下说明选择数据源和上传文件。

    参数

    是否必须

    说明

    选择数据源

    支持导入常规类型文件导入结构化文件

    • 导入常规类型文件

      • 支持格式:PDF、DOC、DOCX、TXT、Markdown 等。

      • 单文件大小限制:PDF 20MB、DOC 20MB、DOCX 20MB、TXT 5MB、MD 5MB。

      • 最多同时上传 100 个文件。

    • 导入结构化文件

      • 支持格式:CSV、JSONL、XLS、XLSX 等。

      • 单文件大小限制为 4MB,最多同时上传 1 个文件。

      • XLS/XLSX/CSV 文件仅取第一个 sheet,且行数不超过 5000 行。

    上传文件

    将文件拖拽至上传区域点击上传,选择本地文件完成导入

  2. 完成文件上传后,根据所选的数据源类型,参考以下说明,配置解析策略分段策略

    • 导入常规类型文件,则需配置以下内容:

      参数

      是否必须

      说明

      解析方式

      支持图片理解表格理解,支持多选、自定义模型、SYSTEM 与 USER 提示词的设置等。目前默认使用Qzhou/qwen3-vl-30b-a3b-instruct模型。

      • 图片理解:使用多模态模型深度理解文档中的图片元素。可通过提示词设置自定义图片解析规则(如判定为表格/流程图、输出格式等)。

      • 表格理解:使用多模态模型胜读理解文档中的表格元素。可通过提示词设置自定义表格解析规则(如 Markdown 格式输出、字段映射等)。

      分段设置

      支持以下三种分段设置,可根据实际选择其中一种:

      • 智能分段清洗:系统自动设置分段规则与预处理规则,适合对参数不熟悉的用户,无需手动配置。

      • 标题分段与清洗根据文档标题层级(如第一章、1.1)进行分段,适合格式规范、标题清晰的文档,可提升知识检索的上下文连贯性。可配置分割最大长度(默认 1024 字符。

      • markdown专用解析:针对标准Markdown格式的文档,星流平台提供强化的架构提取功能,以提高文档智能分析的精确度。

      • 分隔符分段与清洗:支持按换行符(\n\n)或自定义分隔符进行分段,适合结构清晰的文档,可实现更个性化的知识切片。

    • 若导入结构化文件,则需配置以下内容:

      参数

      是否必须

      说明

      表名称

      自动填充为文件名,可自定义修改,用于标识结构化知识集合。

      表描述

      支持最多 200 个字符,用于说明表的业务场景、数据来源等信息。

      表结构

      表格结构需配置以下内容:

      • 列名:自动识别文件中的列标题,可根据业务需求修改。

      • 描述:需输入 2 个字符以上的描述,说明该列的业务含义(如"用户问题""模型回答""业务指标值")。

      • 数据类型:默认设置为 text,支持根据数据特性调整,确保后续检索与应用的准确性。

      • 操作:可删除冗余列,仅保留核心业务字段。

      解析方式

      支持图片理解表格理解,支持多选、自定义模型、SYSTEM 与 USER 提示词的设置等。目前默认使用Qzhou/qwen3-vl-30b-a3b-instruct模型。

      • 图片理解:使用多模态模型深度理解文档中的图片元素。可通过提示词设置自定义图片解析规则(如判定为表格/流程图、输出格式等)。

      • 表格理解:使用多模态模型胜读理解文档中的表格元素。可通过提示词设置自定义表格解析规则(如 Markdown 格式输出、字段映射等)。

      分段设置

      仅支持以下分段设置:

      智能分段清洗:系统自动设置分段规则与预处理规则,适合对参数不熟悉的用户,无需手动配置

  3. 完成上述操作后,点击下一步:索引设置,进入知识库设置环节。

步骤三:索引与检索设置

  1. 索引设置步骤中,参考以下说明,对知识库进行检索设置。

    参数

    是否必须

    说明

    索引方式

    默认为快速检索。该检索方式文档处理速度快,适合上传文档数量较多且文档结构简单的场景,可提升大规模知识库的检索响应效率

    检索设置

    默认为智能检索,其是基于图索引技术的智能检索方案,支持多路检索召回,适合对检索精度要求较高的场景。

    向量检索

    该设置项,需配置以下参数:

    • Top K:用于筛选与用户问题相似度最大的文本片段,系统会根据选用模型的上下文窗口大小动态调整分段数量。取值范围为 1–50,数值越大召回切片越多,可提升召回覆盖率,但会增加计算开销。

    • Score阈值:可根据实际需要选择开启或关闭。其用于设置文本片段筛选的相似度阈值,取值范围为 0–1。阈值越高,仅保留与查询高度相关的切片,可提升结果精准度;阈值越低,召回范围更广,可避免遗漏潜在相关内容。

    倒序检索

    该设置项,需配置以下参数:

    • Top K:与向量检索的 Top K 逻辑一致,用于控制倒排检索召回的切片数量,取值范围为 1–50。

    • Score阈值:可根据实际需要选择开启或关闭。用于设置倒排检索片段的相似度阈值,取值范围为 0–1,可根据业务需求灵活调控召回精度。

    Rerank模型

    开启后可选择指定的重排序模型(如 Qzhou/BGE-Reranker-v2-m3),对多路检索召回的结果进行二次排序,进一步提升 Top N 结果的相关性。

    需配置以下参数:

    • Top K:控制重排序后输出的切片数量,取值范围为 1–50。

    • Score阈值:可根据实际需要选择开启或关闭。设置重排序后片段的筛选阈值,取值范围为 0–1,仅保留排序后得分高于阈值的切片。

  2. 上述参数设置完成之后,点击 保存即可完成整个知识库的创建。

创建空知识库

操作步骤

  1. 登录星流平台,在顶部导航栏,选择模型应用服务 > 知识库

  2. 在知识库列表页面,点击 +新建 ,在下拉菜单中选择 新建空知识库 选项。

  3. 在弹出的 新建空知识库 窗口中,完成以下信息配置。

    参数

    是否必须

    说明

    名称

    当前知识库的名称,支持 1–40 个字符,可包含字母、中文、数字及 -_、/() 等符号,用于唯一标识知识库。

    描述

    支持最多 200 个字符,用于补充说明知识库的业务场景、用途等信息,便于后续管理与协作。

  4. 信息填写完成后,点击 确定 按钮,系统将自动创建空知识库并返回至知识库列表页面,新创建的空知识库卡片将展示在列表中。

后续操作

  • 上传文档:支持向已创建的知识库中添加文档。

  • 召回测试:支持对知识库进行召回测试等操作。

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈