解决docker: Error response from daemon: could not select device driver ““ with capabilities: [[gpu]].
这个错误
could not select device driver "" with capabilities: [[gpu]]
通常是由于 Docker 没有正确识别到 GPU,或者 NVIDIA Docker 配置不正确。
一、检查主机 GPU 和 NVIDIA 驱动是否正常工作
执行
nvidia-smi
确认主机的 GPU 运行环境是否正常
如果命令输出错误,需要先确保 NVIDIA 驱动正确安装
二、检查 NVIDIA 容器工具包是否安装
执行
dpkg -l | grep nvidia-container-toolkit
确认 NVIDIA 容器工具包是否已正确安装
如果没有任何信息出现,则使用以下命令安装
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
&& curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
&& curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt update
sudo apt install -y nvidia-container-toolkit
sudo systemctl restart docker
三、Docker运行时使用 NVIDIA配置
sudo vim /etc/docker/daemon.json
添加以下内容(如果已有其他配置,保留其他配置):
{
"default-runtime": "nvidia",
"runtimes": {
"nvidia": {
"path": "nvidia-container-runtime",
"runtimeArgs": []
}
}
}
编辑完长这样
在vim界面,输入:wq退出编辑状态
四、保存后重启 Docker
sudo systemctl restart docker
删除之前的容器,重新启动容器,及可调用GPU