V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
yjcn
V2EX  ›  Linux

btrfs corrupt 数量持续增长 原因是啥呢?

  •  
  •   yjcn · 2023-07-24 13:26:43 +08:00 · 1664 次点击
    这是一个创建于 424 天前的主题,其中的信息可能已经有所发展或是发生改变。

    unraid 上拿了块爱国者 p5000z 当缓存盘,默认使用的是 btrfs 发现 corrupt 一直在增加,是固态硬盘体质的问题吗? Google 了一波 unraid 官方都是建议跑下 memetest86 排除下内存原因 我跑了 2 次都是 pass 看着不是内存的锅

    Jul 24 12:47:01 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 192, gen 0
    Jul 24 12:47:01 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 352 off 679936 csum 0xd522135e expected csum 0xf038c045 mirror 1
    Jul 24 12:47:01 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 193, gen 0
    Jul 24 13:15:05 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 286 off 4337909760 csum 0x2b937fde expected csum 0x9fed556b mirror 1
    Jul 24 13:15:05 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 194, gen 0
    Jul 24 13:19:51 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 272 off 1601867776 csum 0x55387ecc expected csum 0x294104e2 mirror 1
    Jul 24 13:19:51 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 195, gen 0
    Jul 24 13:20:03 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 278 off 9227800576 csum 0xc036916f expected csum 0x4b8aade4 mirror 1
    Jul 24 13:20:03 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 196, gen 0
    
    第 1 条附言  ·  2023-07-26 12:50:57 +08:00
    换了对内存条 发现还是会有 corrupt 难受了 到底是啥原因呢。。。
    第 2 条附言  ·  2023-08-07 00:17:36 +08:00
    现在看起来也不是固态硬盘的锅 换了块 pc005 也是一样的表现 现在发现连续写入就会出问题 太难了 难道是 cpu 或者主板的锅? cpu 我确实是 12 代 es qygd 之前没加固态用着没啥问题 主板是精粤的 b760i 搞不懂了
    11 条回复    2023-07-26 19:29:39 +08:00
    cheng6563
        1
    cheng6563  
       2023-07-24 14:14:52 +08:00
    内存不带校验的话基本就是内存问题了,这种跑测试一般跑不出来的。
    有 RAID 吗?有的话能自动修复吧。
    yjcn
        2
    yjcn  
    OP
       2023-07-24 14:21:15 +08:00
    @cheng6563 木有加 raid 那这种内存问题还比较尴尬 请问还有啥定位方法吗? 两条科赋的 ddr4 3200 条子 之前在主力机上 打游戏好像也没出现啥问题 后来放到 nas 上了
    cheng6563
        3
    cheng6563  
       2023-07-24 15:53:03 +08:00
    @yjcn 普通内存就是这样的,你以前打游戏没出问题是因为 NTFS 根本没带校验出了问题你也不知道。
    mokiki
        4
    mokiki  
       2023-07-24 16:10:04 +08:00   ❤️ 1
    硬盘问题的可能性更大
    yjcn
        5
    yjcn  
    OP
       2023-07-24 16:47:46 +08:00
    @cheng6563 好吧 这就比较难受了 如果 memtest 这种测不出来 就只能排除法试试了 先换一对内存条子试试看 主要是还不好排除其他因素影响 比如 @mokiki 老哥说的也可能是硬盘的锅
    yjcn
        6
    yjcn  
    OP
       2023-07-24 16:53:07 +08:00
    或者换个文件系统 不行就切回 xfs ?
    yanqiyu
        7
    yanqiyu  
       2023-07-24 17:07:18 +08:00
    dmesg 里面可能有具体出问题的文件路径
    以及可以跑一遍 scrub 看看具体怎样
    wizardyhnr
        8
    wizardyhnr  
       2023-07-25 23:19:35 +08:00
    smartmoontools 能看见 Media and Data Integrity Errors 不,会不会已经有 0E 了.
    yjcn
        9
    yjcn  
    OP
       2023-07-26 12:49:53 +08:00
    @wizardyhnr 木有 盘是新买的 也 check 过 smart 没有 0e 就很迷
    yjcn
        10
    yjcn  
    OP
       2023-07-26 12:50:36 +08:00
    换了对内存条 发现还是会有 corrupt 难受了 到底是啥原因呢。。。
    busier
        11
    busier  
       2023-07-26 19:29:39 +08:00
    盘的问题!说白了,相当于你在硬盘 btrfs 文件系统上存了一大堆文件,然后在读的时候,被 btrfs sum check 发现与存的时候不一致!

    排除内存问题导致的计算错误!大概率就是硬盘问题!

    还有一种小概率的可能性,就是另一个直接以设备块方式操作硬盘的程序(例如 dd )绕过 btrfs 文件系统,直接在写硬盘块设备!
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4542 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 10:00 · PVG 18:00 · LAX 03:00 · JFK 06:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.