模型微调

更新时间：2025-08-06 18:00:25

模型微调通过配置参数和资源，优化预训练模型以适应特定任务或场景需求。

前提条件

您已经获取LlamaFactory Online账户和密码，如果需要帮助或尚未注册，可参考注册账户完成注册。
当前账号的余额充裕，可满足模型微调服务的需要。点击可了解最新的活动及费用信息，或前往充值，如需了解更多请联系我们。
平台为您提供了内置的模型和数据集，若您想使用自己的模型和数据集，可参考文件管理进行模型和数据集上传。自定义数据集处理部分可参考数据处理。

概览

模型微调界面共分为训练参数配置和训练资源配置两个部分，如下图所示，具体说明见下表。

序号	模块名称	模块说明
①	“默认参数”与“历史参数”选择区域	选择“默认参数”或历史“任务参数”，您可以一键完成参数配置。
②	具体参数配置区域	您可以根据需求选择“快速微调”或“专家微调”来进行参数配置，配置内容包括：基础配置、训练配置、资源配置和价格优惠模式。
③	配置显示区域	显示当前训练的资源总数、预估时长以及预估费用，消费明细中显示代金券消费及账户余额消费明细，点击[开始训练]按钮即可开始模型微调。

①、②提到的四种参数配置方式，具体说明与适用场景如下表所示。

配置方式	参数说明	适用场景
“默认参数”	“默认参数” 是平台的预置参数，点击 “默认参数” 后，所有数据恢复默认值。	首次尝试、快速验证
“任务参数”	历史任务的参数，您可以一键复用。	迭代优化、任务复现
“快速微调”	需要配置训练轮数、学习率、批处理大小等基本参数。	轻量级任务、追求效率
“专家微调”	需要配置LoRA参数、RLHF参数、GaLore参数等进阶参数。	精细调整、极致调优

操作步骤

进入LlamaFactory Online平台，注册并登录账户，且需保障账户内有余额。
点击“控制台”，进入控制台后点击左侧导航栏的“模型微调”进入页面。
进行参数配置。您可以根据需求在以下四种配置参数的方法中选择任意一种进行配置。您可以参考[参数介绍]了解各个参数的类型及含义。

配置平台默认参数
配置历史任务参数
配置快速微调参数
配置专家微调参数

点击右上角的 “默认参数” ，完成一键配置平台默认参数，如下图高亮①所示。您可以通过参数介绍了解具体参数的默认值。
选择“基础模型”和“数据集”。选择您要微调的模型以及需要使用的数据集，数据集可以从公共数据中选取，也可以通过文件管理选择自定义的数据集，如下图高亮②所示。您可以参考文件管理上传自定义数据集。若自定义数据集需要预处理，请参考数据处理。
提示
- 点击“默认参数”后，所有参数值（包括模型和数据集，快速微调和专家微调中的参数）都填充为默认值，资源配置的GPU卡数默认为1。
- 平台支持多个数据集微调。 在选择数据集时，您可以同时选择公共数据中的内置数据和文件管理中的自定义数据。
- 在选择 “默认参数” 配置后，您仍可以在“训练配置”中更改“快速微调”或“专家微调”模式下的任意参数。

选择价格优惠模式。 可根据模型训练需求选择合适的模式。

默认参数1

目前平台提供“极速尊享”、“动态优惠”和“灵动超省”三种价格优惠模式。不同模式的计费说明如下：

模式	排队时长	优惠折扣	适用场景
极速尊享	优先使用算力，无需长时排队	无优惠折扣	时效要求高的任务
动态优惠	排队时长因闲忙时段影响，在1-3小时内浮动	优惠折扣由预估排队时长、预估运行所需总卡时、GPU资源闲忙情况多因素影响在5-10折区间波动	紧迫程度较低的任务
灵动超省	5小时以上排队，资源不足时任务会被停止，充足时继续训练	享2.5-5折优惠	灵活度高和中断容忍度高的任务

开始训练。点击开始训练，即可进行任务训练。底部显示本次训练的资源总数、预估时长以及预估费用，消费明细中显示代金券消费及账户余额消费明细，点击即可开始训练。

点击右上角 “任务参数”，进行历史任务参数配置。“任务参数”是历史微调任务中所配置的参数，您可以选择相似的历史任务直接复用其参数。
在历史任务列表中选择您想复用的历史任务名称(也可以通过上方检索框检索)，点击右下角“确认”，完成任务参数配置，如下图所示。

在步骤5的历史任务列表中，您可点击 “详情”，查看相应任务的详细信息，包括基本信息、超参数、训练图表及日志。对于运行成功的历史任务，您可以选择右上角的“对话”、“评估”、“参数复用”操作。
进行基础配置。选择您要微调的模型以及需要使用的训练数据，数据集可以从公共数据中选取，也可以通过文件管理选择自定义的数据集。您可以参考文件管理上传自定义数据集。若自定义数据集需要预处理，请参考数据处理。选择训练方式、微调方法、确认验证集切分比例已是否合并模型。
提示
- 点击“任务参数”，明确所选任务后，所有参数值（包括模型和数据集，快速微调和专家微调中的参数）都填充为该任务的参数值，资源配置的GPU卡数也同步更改。
- 平台支持多个数据集微调。 在选择数据集时，您可以同时选择公共数据中的内置数据和文件管理中的自定义数据。
- 在选择 “任务参数” 配置后，您仍可以在“训练配置”中更改“快速微调”或“专家微调”模式下的任意参数。

选择价格优惠模式。 可根据模型训练需求选择合适的模式。

默认参数1

目前平台提供“极速尊享”、“动态优惠”和“灵动超省”三种价格优惠模式。不同模式的计费说明如下：

模式	排队时长	优惠折扣	适用场景
极速尊享	优先使用算力，无需长时排队	无优惠折扣	时效要求高的任务
动态优惠	排队时长因闲忙时段影响，在1-3小时内浮动	优惠折扣由预估排队时长、预估运行所需总卡时、GPU资源闲忙情况多因素影响在5-10折区间波动	紧迫程度较低的任务
灵动超省	5小时以上排队，资源不足时任务会被停止，充足时继续训练	享2.5-5折优惠	灵活度高和中断容忍度高的任务

开始训练。点击开始训练，即可进行任务训练。底部显示本次训练的资源总数、预估时长以及预估费用，消费明细中显示代金券消费及账户余额消费明细，点击即可开始训练。

进行基础配置。选择您要微调的模型以及需要使用的训练数据，数据集可以从公共数据中选取，也可以通过文件管理选择自定义的数据集。您可以参考文件管理上传自定义数据集。若自定义数据集需要预处理，请参考数据处理。选择训练方式、微调方法、确认验证集切分比例已是否合并模型

提示
平台支持多个数据集微调。 在选择数据集时，您可以同时选择公共数据中的内置数据和文件管理中的自定义数据。
进入“快速微调”模式。点击训练配置框右上角的 “快速微调”，进入快速微调模式，配置相应的训练参数。
选择资源配置。 点击下拉框，可选择微调训练时的GPU卡数。

默认数值为自动推荐的GPU卡数，具体选择请参照“如何选择GPU卡数”。付费方式目前仅支持按量付费。

选择价格优惠模式。 可根据模型训练需求选择合适的模式。

默认参数1

目前平台提供“极速尊享”、“动态优惠”和“灵动超省”三种价格优惠模式。不同模式的计费说明如下：

模式	排队时长	优惠折扣	适用场景
极速尊享	优先使用算力，无需长时排队	无优惠折扣	时效要求高的任务
动态优惠	排队时长因闲忙时段影响，在1-3小时内浮动	优惠折扣由预估排队时长、预估运行所需总卡时、GPU资源闲忙情况多因素影响在5-10折区间波动	紧迫程度较低的任务
灵动超省	5小时以上排队，资源不足时任务会被停止，充足时继续训练	享2.5-5折优惠	灵活度高和中断容忍度高的任务

开始训练。点击“开始训练”，即可进行任务训练。底部显示本次训练的资源总数、预估时长以及预估费用，消费明细中显示代金券消费及账户余额消费明细，点击即可开始训练。

进行基础配置。选择您要微调的模型以及需要使用的训练数据，数据集可以从公共数据中选取，也可以通过文件管理选择自定义的数据集。您可以参考文件管理上传自定义数据集。若自定义数据集需要预处理，请参考数据处理。选择训练方式、微调方法、确认验证集切分比例已是否合并模型。

提示
平台支持多个数据集微调。 在选择数据集时，您可以同时选择公共数据中的内置数据和文件管理中的自定义数据。
进入“专家微调”模式。 点击训练配置框右上角的“专家微调”，进入专家微调模式。

专家微调的训练配置扩展了LoRA参数设置、RLHF参数设置、GaLore参数设置等。您可以参考[参数介绍]了解各个参数的类型及含义。
选择资源配置。 点击下拉框，可选择微调训练时的GPU卡数。默认数值为自动推荐的GPU卡数，具体选择请参照“如何选择GPU卡数”。付费方式目前仅支持按量付费。

选择价格优惠模式。 可根据模型训练需求选择合适的模式。

默认参数1

目前平台提供“极速尊享”、“动态优惠”和“灵动超省”三种价格优惠模式。不同模式的计费说明如下：

模式	排队时长	优惠折扣	适用场景
极速尊享	优先使用算力，无需长时排队	无优惠折扣	时效要求高的任务
动态优惠	排队时长因闲忙时段影响，在1-3小时内浮动	优惠折扣由预估排队时长、预估运行所需总卡时、GPU资源闲忙情况多因素影响在5-10折区间波动	紧迫程度较低的任务
灵动超省	5小时以上排队，资源不足时任务会被停止，充足时继续训练	享2.5-5折优惠	灵活度高和中断容忍度高的任务

开始训练。点击“开始训练”，即可进行任务训练。底部显示本次训练的资源总数、预估时长以及预估费用，消费明细中显示代金券消费及账户余额消费明细，点击即可开始训练。

前提条件​

概览​

操作步骤​

前提条件

概览

操作步骤