本来要安装 gpu 版本,安装显卡驱动并安装和 nvidia 容器工具包后,运行docker run --gpus all --rm nvidia/cuda nvidia-smi
,可以看到正常结果,然后正常安装 tensorflow-gpu docker 容器(里面的 tengsorflow 可以正常运行),完成后 exit 退出 ssh,过一段时间再次链接再次运行发现docker run --gpus all --rm nvidia/cuda nvidia-smi
会卡死,同时 tensorflow 容器里面提示无法找到显卡,而运行其他非 docker 的 gpus 命令正常,有人遇到吗?百思不得其解,我尝试重新重启并从安装显卡驱动开始又恢复正常,然后过段时间后又失效