跳到主要内容

如何查看运行过程中GPU状态

更新时间:2025-07-17 18:30:25

💡 问题表现:

在使用llamafact进行训练微调的时候,想要查看GPU的状态信息,包括:显存占用率、GPU利用率等。

✅ 解决方法:

方法一:使用 NVIDIA-SMI 工具

可以使用nvidia-smi命令来查看GPU的状态信息。在jupyter中输入以下命令:

nvidia-smi

这个命令会显示当前所有NVIDIA GPU的详细状态,包括显存占用率、GPU利用率、温度等信息。 image

方法二:使用SwanLab查看

1.点击注册swanlab,注册账号并获取apikey。
2.将获取到的swanlab apikey填入jupyter notebook的配置文件。 image 3.各项参数配置完成后,单击“开始”按钮,执行大模型的微调任务。开始微调后,页面最下方会显示微调过程的日志。用户可在已登录的SwanLab的“图标对比视图”查看各类图表,示例如下图所示。 image