跳到主要内容

系统弹窗“数据集检测失败”问题排查

更新时间:2025-09-08 18:30:25

问题表现

用户在JupyterLab数据处理空间的user-data/datasets目录下上传自定义数据集后,返回至[文件管理]菜单的“数据集”页签,点击“数据集检测”链接,页面提示“数据集检测失败”,例如下图高亮④所示。

image

问题原因

目前,LLaMA Factory Online平台仅支持AlpacaShareGPT两种数据格式。若上传的数据不符合其中任一格式,系统将自动弹出提示“数据集检测失败”,以帮助用户及时识别数据集可能存在的格式问题。

解决办法

  1. 您可以编写代码或其它辅助工具将数据集转换为AlpacaShareGPT格式。以未通过数据集检测的一组数据为例,该数据格式混合了数组和纯文本,例如下图所示。

    image

  2. 将转换后的自定义数据集更新至JupyterLab数据处理空间的user-data/datasets目录下,处理后的数据集格式符合Alpaca格式,使用instructioninputoutput三个字段,例如下图所示。

    image

  3. 返回至[文件管理]菜单中的“数据集”页签,刷新页面并点击“数据集检测”链接。数据集格式检测提示“符合”,如图中高亮区域④所示。

    image