V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Citrus
V2EX  ›  问与答

618 京东入了个希捷酷狼,看 S.M.A.R.T. 有些疑惑,求大佬解答

  •  
  •   Citrus · 2020-06-07 14:54:55 +08:00 · 1915 次点击
    这是一个创建于 1630 天前的主题,其中的信息可能已经有所发展或是发生改变。

    具体数据如图:

    SMART1.png

    SMART2.png

    SMART3.png

    1 RAW_READ_ERROR_RATE 搜了下希捷似乎都这样,那先放一边。拉到最下面,看 HEAD_FLYING_HOURS TOTAL_LBA_WRITTEN 也大的吓人,不知道这俩是啥情况?求大佬指教。另外 ECC_ON-THE-FLY_ERROR 也很大,不知道啥情况。。。

    第 1 条附言  ·  2020-06-08 15:23:32 +08:00
    搜索了一下找到了这么一个文章:
    http://www.users.on.net/~fzabkar/HDD/Seagate_SER_RRER_HEC.html
    根据作者的研究,希捷的部分 S.M.A.R.T. 数据是由两部分拼接出来的。
    例如 Seek Error Rate,总共是 48 bits,也就是 0x0000_00000000 这么长的一串。
    其中,高 16 位表示错误计数,低 32 位表示总数。
    那么,截图中的 6272437 就是 0x0000_005FB5B5,说明已经有 627_2437 次寻道,尚未出现错误。
    带入公式,算出值应为 -10 log(1/6272437) = 67.97 ,与图中的 68 吻合。
    8 条回复    2020-06-08 19:29:25 +08:00
    msg7086
        1
    msg7086  
       2020-06-08 08:34:13 +08:00
    读取量 4TB 写入量 4TB ?你这是盘扔进了阵列做了初始化吗?
    Citrus
        2
    Citrus  
    OP
       2020-06-08 10:56:23 +08:00
    @msg7086 哦!好像还真是,那说明 TOTAL_LBA_WRITTEN 和 TOTAL_LBA_READ 是正常的。但是其他的参数还是很奇怪。。。特别是 HEAD_FLYING_HOURS,算下来几百亿年了。。。
    msg7086
        3
    msg7086  
       2020-06-08 11:11:38 +08:00
    @Citrus HEAD_FLYING_HOURS 你知道要怎么解读原始数据吗?
    0x D151 0000 0026

    看上去是 0xD151 和 0x26 拼起来的,0x26 是 38 小时,和你的 POH 一样长啊。0xD151 就不知道是什么了。

    RAW 数据不要就当成真实值,所有的硬盘厂家都有独特的 RAW 解读方式。包括你前面提的 RAW_READ_ERROR_RATE 内部其实也是存了不止一份数据。比如说他 error rate 可以保存两个数字,一个是错误数量,一个是总读取数量,比如他存了 0010 1000 来表示 1%的错误率,结果你强行按照 101000 来解读,说有十万个错误,这不是拍脑袋瞎想么。
    Citrus
        4
    Citrus  
    OP
       2020-06-08 12:20:54 +08:00
    @msg7086 你说各个厂商有独特的读取方式我理解。不过我觉得比较奇怪的是,我买了 3 块型号完全一样的盘,只有这块有这个现象。另外两块盘,数据读出来都是对的。。。
    Citrus
        5
    Citrus  
    OP
       2020-06-08 15:07:16 +08:00
    @msg7086 我错了!我可能是因为另外两块盘我看信息的时候是刚插进去,所以数值很小。现在三块盘都重建完了,表现完全一样了。。。
    RAW_READ_ERROR_RATE 全都巨大,7 千万,1.1 亿,5 千万
    SEEK_ERROR_RATE 1 千万
    ECC_ON-THE-FLY_ERROR 1.1 亿

    看来是要去单独查希捷的数值定义了么。。。
    msg7086
        6
    msg7086  
       2020-06-08 15:10:31 +08:00
    希捷都不一定会公开这些内部数据的定义。本来 RAW 值就是内部使用的,特别是这些常绿的统计值。
    Citrus
        7
    Citrus  
    OP
       2020-06-08 15:14:40 +08:00
    @msg7086 我找到了,太坑了。。。我 Append 一下
    msg7086
        8
    msg7086  
       2020-06-08 19:29:25 +08:00 via Android
    @Citrus 看了你的追加,意料之中吧。就是统计错误数和总数,放在同一栏里。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2808 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 14:02 · PVG 22:02 · LAX 06:02 · JFK 09:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.