V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
yyysuo
V2EX  ›  问与答

关于 RAC 所在服务器偶发性 ping 丢包的问题,请教各位大佬。

  •  
  •   yyysuo · Jul 30, 2023 · 1414 views
    This topic created in 1005 days ago, the information mentioned may be changed or developed.
    数据库 RAC
    2 节点,2 台物理机
    内存 192GB
    redhat 6.9

    应用 HA:
    2 节点,2 台物理机
    内存 192GB
    redhat 7.5

    现象:去年突然发现应用运行极缓慢,经排查是数据库的 2 个节点之间互 ping 丢包 50%以上,应用 ping 数据库 2 个节点丢包也在 50%以上,重启数据库节点网络服务后,问题立马解决。
    上周五又突然出现了此问题,重启数据库节点网络服务后,问题又解决了。

    排查:
    OS 日志无异常
    应用日志无异常。
    数据库不会查。
    问题发生时,4 台物理机,cpu 、内存均无压力。

    求问各位大佬,这种情况,应该往哪个方向排查?
    8 replies    2023-07-31 00:12:35 +08:00
    RatioPattern
        1
    RatioPattern  
       Jul 30, 2023
    交换机
    we6100
        2
    we6100  
       Jul 30, 2023 via iPhone
    Ping 的话,最好不要是 vip 而且物理 ip ,也可以出问题的时候关一个节点试一下,是不是 Rac 的问题还是硬件问题
    yyysuo
        3
    yyysuo  
    OP
       Jul 30, 2023
    @RatioPattern 现在的状态是系统受到监控的,不能随便停,有没有哪边的日志,或者一种技术手段,能够确认到出问题的环节?
    yyysuo
        4
    yyysuo  
    OP
       Jul 30, 2023
    @we6100 忘记说另外一个情况了,把数据库关了依然是丢包的状态,重启一下网络立即就好,好上一年自己突然就坏了。
    we6100
        5
    we6100  
       Jul 30, 2023 via iPhone
    @yyysuo 数据库只是 Rac 的一个资源,很有可能是 rac 有问题
    yyysuo
        6
    yyysuo  
    OP
       Jul 30, 2023
    @we6100 可是我用的操作系统自己的 ping 呀,rac 不了解,会影响到系统的 ping 吗。
    RatioPattern
        7
    RatioPattern  
       Jul 31, 2023
    @yyysuo 交换机支持 SNMP 的话可以用 SNMP 看下设备占用
    RatioPattern
        8
    RatioPattern  
       Jul 31, 2023
    感觉可能网络风暴
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   836 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 21:12 · PVG 05:12 · LAX 14:12 · JFK 17:12
    ♥ Do have faith in what you're doing.