V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
YongXMan
V2EX  ›  服务器

关于硬盘和硬件 RAID 卡问题

  •  
  •   YongXMan · 2023-05-26 22:59:21 +08:00 · 1317 次点击
    这是一个创建于 547 天前的主题,其中的信息可能已经有所发展或是发生改变。

    OP 目前在用 DELL R720XD 平台,H710p RAID 卡,插了 10 块盘,由于没有刷 IT 模式,好几块都是做的单盘 RAID0 ,ESXI 虚拟平台,其中安装了黑裙。

    最近遇到过几次黑裙掉盘的情况,出问题的应该是其中一个单盘 RAID0 ,这个盘并没有直通给黑群晖,在黑群晖内核日志中看到的现象是其他所有的硬盘读写都报了 IO ERROR ,然后导致掉盘,存储池故障。移除这块“坏盘”后问题没有再出现。

    有几个疑问:

    1. 把上面拆下的“坏盘”取下来用 DiskGenius 做了一次全盘扫描,并没有坏块,smart 信息没有发现异常,但在 ESXI 上读写这块盘的时候是有卡顿的情况,硬盘应该有点不正常,是 smart 信息不准确?

    2. 是否有可能是 RAID 卡故障,感觉不太可能,移除这块硬盘后就正常了,没有再出现掉盘的情况,感觉还是硬盘的问题。

    3. RAID 卡上的多组虚拟硬盘之间会互相影响吗,其中一块硬盘故障会影响其他所有的 RAID 组硬盘?如何会互相影响,这样感觉还不如全部直通然后通过软件 RAID 可用性高?

    4 条回复    2023-06-05 21:02:51 +08:00
    ryd994
        1
    ryd994  
       2023-05-27 00:56:16 +08:00 via Android   ❤️ 1
    1. smart 只是统计数据。硬盘故障前并不一定有预兆
    2. 不一定,如果是这个端口坏了呢?
    3. 正常来讲不应该。有可能是非企业硬盘没有 tler 。遇到坏扇区就长时间重试。

    本来就应该刷 IT 。硬 raid 基本上属于历史遗留技术。
    YongXMan
        2
    YongXMan  
    OP
       2023-05-27 07:35:18 +08:00 via Android
    @ryd994 感谢回答。
    1. 实际情况是发生过好几次故障导致其他盘读写异常,这些信息也应该被统计进去,事实上 smart 信息没有什么异常。扫描了 30 多小时没有发现坏块,是不是有可能是硬盘其他机械结构有问题?
    2. 不是端口问题,更换过硬盘位,和盘位没关系。
    3. 这块确实是家用普通 sata 盘,4T ,但是它影响到了其他的企业 sas 盘的读写了。
    busier
        3
    busier  
       2023-06-05 19:19:23 +08:00 via iPhone
    考虑下 电源是不是用了多年 供电不行了
    YongXMan
        4
    YongXMan  
    OP
       2023-06-05 21:02:51 +08:00 via Android
    @busier 如果供电有问题,更换硬盘问题应该不会消失,现在情况是更换硬盘后问题没再出现
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   997 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 23:08 · PVG 07:08 · LAX 15:08 · JFK 18:08
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.