clacf1
V2EX  ›  问与答

系统错误日志疯狂刷新,我该如何优化

  •  
  •   clacf1 · Oct 25, 2023 · 1246 views
    This topic created in 932 days ago, the information mentioned may be changed or developed.

    十几个应用组成的业务系统,每个应用都疯狂打 error 日志,一天加一起能有 17w 个。领导让我提高稳定性,降低这些日志数量,消除对系统有影响的风险。然后我提了一百多个 bug 单,开发的意思,大部分是参数校验报错,要么就是配置问题,导致空指针。也不给处理,现在已经一团乱麻了。

    我想问下各位运维开发大佬,针对这种情况,我该如何处理,我现在能想到的方案:

    1. bug 单如果没有影响, 开发需要把包装日志,提供一个错误码,我好过滤,不能简单的给我打回来。
    2. 日志中心那边改造下,需要能够通过错误码筛选,当前只有四个级别可供选择
    3. 我可以要求他们把参数校验报错,改成 warn 的日志级别吗? 不知道这种该不该算是 error 的错误。
    7 replies    2023-10-25 13:05:08 +08:00
    yidinghe
        1
    yidinghe  
       Oct 25, 2023
    既然业务开发人员有能力辨别一条错误日志需不需要处理,那对于不需要处理的情况,就不要打日志了
    sujin190
        2
    sujin190  
       Oct 25, 2023
    参数校验既然不是错误为啥要写错误日志,空指针异常报错居然不是 bug 真是。。你们这测试真可有够严谨的,正常的应用不都是上线不允许有 errror 级别日志,否则监控系统直接报异常

    error 级别日志输出一般应该包含两种,一是硬件或系统非预期异常,第二种就是不在设计业务流程的非预期异常,参数校验校验本来就属于业务流程一部分的而且也需要测试,所以应该属于符合业务流程且在预期内的异常,顶多算个 waring 吧
    8355
        3
    8355  
       Oct 25, 2023
    开发垃圾啊。。。没得救
    silentsky
        4
    silentsky  
       Oct 25, 2023 via Android
    @yidinghe 这种开发可以开了 有意义的异常才打出来也有利于监控
    julyclyde
        5
    julyclyde  
       Oct 25, 2023
    error 级别的日志是不是 error 内容呢?
    如果是的话,那你摊上大事了
    如果不是,先整改吧
    julyclyde
        6
    julyclyde  
       Oct 25, 2023
    第二点估计是不可能的
    根据错误码筛选,相当于你让日志中心针对你这个错误的日志源做定制开发,背离行业规范

    第三点那是调用方的问题啊,让调用方整改;被调方出个 error 或者 warn 我觉得都不算什么问题
    日志的用途是发现问题,不是掩盖问题
    potatowish
        7
    potatowish  
       Oct 25, 2023 via iPhone
    见过一些开发,参数检验他也抛个异常出来,打印一堆异常栈
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5446 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 59ms · UTC 05:51 · PVG 13:51 · LAX 22:51 · JFK 01:51
    ♥ Do have faith in what you're doing.