V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Jat001
V2EX  ›  问与答

新装的 manjaro,所有网络相关的命令都会被卡住

  •  
  •   Jat001 · 2020-05-23 21:38:53 +08:00 via Android · 3099 次点击
    这是一个创建于 1627 天前的主题,其中的信息可能已经有所发展或是发生改变。
    甚至 sudo ls 都不行,kill -9 也杀不掉
    打开网络连接,显示需要运行 networkmanager
    ,但 systemctl 显示它正在运行,日志也没看出什么问题,ip 都能获取到
    因为我另外装了个 pcie 网卡,怀疑是它的问题,问题是现在连 sudo 都不能用,我实在不知道该怎么 debug


    第 1 条附言  ·  2020-05-24 00:51:26 +08:00
    好多带网口的 usb hub 都有这问题,他们说拔了重插就好,但我这是 pcie 上的 usb hub 啊……

    https://bugzilla.kernel.org/show_bug.cgi?id=198931
    https://bugzilla.kernel.org/show_bug.cgi?id=200977

    两年前就有这问题了,现在仍没解决……
    第 2 条附言  ·  2020-05-24 01:25:20 +08:00
    找到了驱动 https://aur.archlinux.org/packages/r8152-dkms/ 虽然开机网络还是会断一段时间,但至少 pcie 网口能用了……
    第 3 条附言  ·  2020-05-24 01:41:23 +08:00
    友情提示:绿联的很多 usb hub 上的网卡都是 RTL8153 芯片,linux 上会导致开机一段时间内网络无法使用,安装驱动可以使网卡能正常使用,但解决不了开机会网路中断的问题
    第 4 条附言  ·  2020-06-10 12:55:33 +08:00
    更新内核到 5.7 之后,终于没有这破 bug 了,顺便还修复了另一个驱动不支持 5.7 的问题,Linux 用户真是蛋疼……
    19 条回复    2020-05-24 10:14:51 +08:00
    Jat001
        1
    Jat001  
    OP
       2020-05-23 21:43:04 +08:00 via Android
    就在我发这个帖子的时候,一切正常了…我明明什么都没干
    看日志确实是 pcie 网卡引起的问题,但为什么能卡将近 20 分钟
    rrfeng
        2
    rrfeng  
       2020-05-23 23:18:49 +08:00
    我之前 MBP 也经常发生这个故障……只能强制重启
    Jat001
        3
    Jat001  
    OP
       2020-05-23 23:22:54 +08:00
    @rrfeng 重启没用,每次开机半小时网络不能用这就很蛋疼
    aapeli
        4
    aapeli  
       2020-05-24 00:05:56 +08:00 via iPhone
    sudo 命令执行时需要解析本机的 hostname 你看下 hosts 文件本机 hostname 是否被解析到 127.0.0.1 如果执行仍然卡住,尝试执行 strace +命令分析系统调用, 例如 strace ls 看卡在哪个系统调用。
    Jat001
        5
    Jat001  
    OP
       2020-05-24 00:32:48 +08:00
    @aapeli 不是因为 hostname 没有解析到 127.0.0.1,而是因为 sudo 调用了网络,等网络恢复了,sudo ls 也正常了。刚才刚装的系统,连 strace 都没有,等网络恢复了才装上,但后来看 dmesg,发现有网络相关的超时。

    这是 stace ip addr 的日志


    ping hostname 是可以 ping 通的,ping 路由器不通
    https://v2ex.com/i/nVBCRjAL.jpeg
    Jat001
        6
    Jat001  
    OP
       2020-05-24 00:35:14 +08:00
    dmesg 日志
    Jat001
        7
    Jat001  
    OP
       2020-05-24 00:41:47 +08:00
    https://bugzilla.kernel.org/show_bug.cgi?id=200977
    内核级别的 bug,带网口的 usb hub 会出现这个问题
    aapeli
        8
    aapeli  
       2020-05-24 01:24:39 +08:00 via iPhone
    sudo 变成 D 进程了 你可以 sudo 执行的时候在 ps 下看 sudo 的状态,D 进程表明 sudo 处于不可中断状态
    aapeli
        9
    aapeli  
       2020-05-24 01:25:29 +08:00 via iPhone
    sudo 在等待 io 设备返回数据
    Jat001
        10
    Jat001  
    OP
       2020-05-24 01:27:10 +08:00
    @aapeli 看我的附言……这是内核 bug,跟 sudo 没关系
    aapeli
        11
    aapeli  
       2020-05-24 01:30:29 +08:00 via iPhone
    @aapeli 解决 d 进程要么重启 要么 io 设备能返回数据 我猜你设备的驱动有 bug 要么设备使用过程中掉了?
    aapeli
        12
    aapeli  
       2020-05-24 01:31:20 +08:00 via iPhone
    ip addr 也变 d 进程 .....
    aapeli
        13
    aapeli  
       2020-05-24 01:31:45 +08:00 via iPhone
    @Jat001 明白了
    tulongtou
        14
    tulongtou  
       2020-05-24 08:54:27 +08:00
    所以 Linux 内核到底在运行多少 bug?
    Jat001
        15
    Jat001  
    OP
       2020-05-24 09:00:37 +08:00
    @tulongtou 我的经验是,这种涉及驱动的 bug 一堆,毕竟只影响少部分用户,关注度低也就没人修,而且这个 bug Realtek 至少要背一半的锅
    ladeo
        16
    ladeo  
       2020-05-24 09:25:24 +08:00 via Android
    没有 1 个操作系统能支持所有的硬件!

    即使是支持度最高的 win10 也有一堆老设备不支持!

    黑苹果的时候都知道查查兼容列表吧

    如果 linux 官方说支持这款设备,那锅是 linux 背。否则就是邮件厂家没有提供 linux 驱动的问题啊。

    再买一块兼容 linux 当前 kernel 版本的网卡就好了
    zachlhb
        17
    zachlhb  
       2020-05-24 10:06:50 +08:00 via Android
    安装版本太新了吧,试试降版本,我的电脑就是所有 5.0 内核以上的版本都跑不起来,所以只能安装老版本然后锁内核不让他升级才行
    Jat001
        18
    Jat001  
    OP
       2020-05-24 10:12:37 +08:00
    @ladeo RTL8153 可不是什么老旧硬件…… https://linux-hardware.org/index.php?id=usb:0bda-8153 5.6 才加入内核,我现在跑的是 5.6.12 。而且你买的时候,那客服有那能力告诉你这产品使用的是什么芯片吗
    linux 世界哪有什么官方,底下一堆发行版哪个不会 patch 内核?更没有什么 linux 官方支持的硬件列表了。
    Realtek 确实提供了驱动,甚至这驱动还更新得很勤,紧跟内核版本 https://github.com/wget/realtek-r8152-linux/
    当前内核版本又是什么鬼……不是所有的发行版都会紧跟 linux kernel 更新的,而且自己升降级也很容易,也能同时装多个版本的内核,在系统启动时选择要运行的内核版本

    最后,你见过 windows 下面一个网卡没驱动会导致所有网络相关的操作全部阻塞的吗?更别提装好驱动都能正常使用了,重启后还会阻塞几十分钟。

    我用 linux 快十年了,至少有一半时间是在 linux 下开发,但不写代码的时候我还是喜欢用 windows,linux 下稀奇古怪的问题太多了。如果你看了我附言里贴的链接,就会发现究竟是 tlp 、驱动还是固件引起的 bug,大家都在猜,真正有能力调这种 bug 的大佬没设备也没时间管这种小事。里面的几个解决方案我也试了,都没用,毕竟发行版和内核版本都不一样,鬼知道是不是发行版 patch kernel 后引起的 bug 。
    Jat001
        19
    Jat001  
    OP
       2020-05-24 10:14:51 +08:00
    @zachlhb 这确实有可能,但实在不想折腾了,又不是主力机,大不了不重启了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2919 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 14:56 · PVG 22:56 · LAX 06:56 · JFK 09:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.