最近有三台 ubuntu20.04 服务器,都是安装的桌面版本,最近有三台频繁出问题。(这三台都是用的国内的内存和硬盘品牌)
出现的问题特征是没有任何响应,但是灯光正常,不是睡眠状态。如果正常接显示器了,显示器会有输出,甚至时间还在向前走,但是硬盘里面没有日志。
日志( syslog )显示从 4.24 11:36~4.26 13:38 之间没有日志产生
这是 4.26 上午 11:33 拍的照片。这个时候系统已经没有任何响应了, 包括 ssh 键盘鼠标,其中运行的服务也没有产生日志。
这是 last 的信息

我这里只看了 syslog syslog.1 日志,不知道从哪里还能看到更多硬件信息和状态。另外这三台机器都有 2060 显卡和 cuda 驱动。
现在的有几个疑惑:
- linux 有没有类似蓝屏机制
- 如果是内存问题,机器的时间还在运行正常不?
- 如果是内存和硬盘问题,怎么确认和找出证据。
- 有没有可能是显卡驱动问题,但是我们已经有 10 几台 ubuntu20.04 的机器了
