跳到主要内容

模型微调

更新时间:2025-08-06 18:00:25

模型微调通过配置参数和资源,优化预训练模型以适应特定任务或场景需求。

前提条件

  • 您已经获取LLama Factory Online账户和密码,如果需要帮助或尚未注册,可参考注册账户完成注册。
  • 当前账号的余额充裕,可满足模型微调服务的需要。点击可了解最新的活动费用信息,或前往充值,如需了解更多请联系我们
  • 平台为您提供了内置的模型和数据集,若您想使用自己的模型和数据集,可参考文件管理进行模型和数据集上传。自定义数据集处理部分可参考数据处理

概览

模型微调界面共分为训练参数配置和训练资源配置两个部分,如下图所示,具体说明见下表。

导览

序号模块名称模块说明
“默认参数”与“历史参数”选择区域选择“默认参数”或历史“任务参数”,您可以一键完成参数配置。
具体参数配置区域您可以根据需求选择“快速微调”或“专家微调”来进行参数配置,配置内容包括:基础配置、训练配置、资源配置和价格优惠模式。
配置显示区域显示当前训练的资源总数、预估时长以及预估费用,消费明细中显示代金券消费及账户余额消费明细,点击即可开始训练。
  • ①、②提到的四种参数配置方式,具体说明与适用场景如下表所示。
图标样式配置方式参数说明适用场景
默认参数“默认参数”“默认参数” 是平台的预置参数,点击 “默认参数” 后,所有数据恢复默认值首次尝试、快速验证。
任务参数“任务参数”历史任务的参数,您可以一键复用。迭代优化、任务复现。
快速微调“快速微调”需要配置训练轮数、学习率、批处理大小等基本参数。轻量级任务、追求效率。
专家微调“专家微调”需要配置LoRA参数、RLHF参数、GaLore参数等进阶参数。精细调整、极致调优。

操作步骤

  1. 进入LLaMA-Factory Online平台,注册并登录账户,且需保障账户内有余额。

  2. 点击“控制台”,进入控制台后点击左侧导航栏的“模型微调”进入页面。

  3. 进行参数配置。您可以根据需求在以下四种配置参数的方法中选择任意一种进行配置。您可以参考[参数介绍]了解各个参数的类型及含义。

  1. 点击右上角的 “默认参数” ,完成一键配置平台默认参数,如下图高亮①所示。您可以通过参数介绍了解具体参数的默认值。

  2. 选择“基础模型”和“数据集”。选择您要微调的模型以及需要使用的数据集,数据集可以从公共数据中选取,也可以通过文件管理选择自定义的数据集,如下图高亮②所示。您可以参考文件管理上传自定义数据集。若自定义数据集需要预处理,请参考数据处理

    默认参数1

    提示
    • 点击“默认参数”后,所有参数值(包括模型和数据集,快速微调和专家微调中的参数)都填充为默认值,资源配置的GPU卡数默认为1。
    • 平台支持多个数据集微调。 在选择数据集时,您可以同时选择公共数据中的内置数据和文件管理中的自定义数据。
    • 在选择 “默认参数” 配置后,您仍可以在“训练配置”中更改“快速微调”或“专家微调”模式下的任意参数。
  3. 选择价格优惠模式。 可根据模型训练需求选择合适的模式。

    任务模式

    • 目前平台提供“极速尊享”、“动态优惠”和“灵动超省”三种价格优惠模式。不同模式的计费说明如下:
    模式排队时长优惠折扣适用场景
    极速尊享优先使用算力,无需长时排队无优惠折扣时效要求高的任务
    动态优惠排队时长因闲忙时段影响,在1-3小时内浮动优惠折扣由预估排队时长、预估运行所需总卡时、GPU资源闲忙情况多因素影响在5-10折区间波动紧迫程度较低的任务
    灵动超省5小时以上排队,资源不足时任务会被停止,充足时继续训练享2.5-5折优惠灵活度高和中断容忍度高的任务
  4. 开始训练。点击开始训练,即可进行任务训练。底部显示本次训练的资源总数、预估时长以及预估费用,消费明细中显示代金券消费及账户余额消费明细,点击即可开始训练。

    开始训练