全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

数据集功能概述

最近更新时间:2026-05-06 17:54:06

在进行数据处理和模型训练之前,您可能需要提前准备相应的数据集。星流平台为您提供相应的数据集管理功能。平台内已提前预置了常见第三方数据集源,您可根据实际应用场景进行选择。若当前公共数据集无法满足业务需求,您也可创建自定义数据集。

预置数据集

星流平台的预置数据集均来来自第三方,如arXiv、huggingface、OpenDataLab、hyperai等,涵盖以下三大主题:

  • 具身智能:包括城市环境模拟、空间理解、机器人学习、AI策略与规划、多模态推理等。

  • 大模型:包括自然语言处理、问答系统、语料库、语言技术等类型。

  • 自动驾驶:包括计算机视觉、网络安全、室内导航等类型。

您可直接在预置数据集页面,一键下载数据集至相应存储配置中,以供后续数据处理和模型训练任务的使用。

自定义数据集

星流平台的自定义数据集服务基于高性能Lance架构,提供了强大的多种模态数据统一托管、可视化、多维度数据筛选和数据切片等功能,帮助您降低高质量数据获取、存储和处理成本。目前自定义数据集服务免费公测中。

您可自主在平台上创建和管理相应自定义数据集

推理数据集

推理数据集主要用于模型推理(预测)阶段的数据集合,您可将在星流模型API服务平台上批量推理的结果保存至推理数据集中进行管理和使用,也可从KS3实例或KPFS实例中获取相应数据集。

您可自主在平台上创建和管理相应推理数据集

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈