如何查看运行过程中GPU状态
💡 问题表现:
在使用llamafact进行训练微调的时候,想要查看GPU的状态信息,包括:显存占用率、GPU利用率等。
✅ 解决方法:
方法一:使用 NVIDIA-SMI 工具
可以使用nvidia-smi
命令来查看GPU的状态信息。在jupyter中输入以下命令:
nvidia-smi
这个命令会显示当前所有NVIDIA GPU的详细状态,包括显存占用率、GPU利用率、温度等信息。
方法二:使用SwanLab查看
1.点击注册swanlab,注册账号并获取apikey。
2.将获取到的swanlab apikey填入jupyter notebook的配置文件。
3.各项参数配置完成后,单击“开始”按钮,执行大模型的微调任务。开始微调后,页面最下方会显示微调过程的日志。用户可在已登录的SwanLab的“图标对比视图”查看各类图表,示例如下图所示。