V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
HawkinsSherpherd

MLAG 主节点掉电后下行交换机无法正常转发流量

  •  
  •   HawkinsSherpherd · Oct 13, 2022 · 1838 views
    This topic created in 1294 days ago, the information mentioned may be changed or developed.
    我最近在 GNS3 里做 MLAG 相关的实验,两台 Arista 交换机组 MLAG 集群,下行是一台思科的 Catalyst 交换机,和两台交换机各有一条链路互联,两侧都绑定链路聚合。Arista 上的 MLAG 都配置了双主检测,并有独立的心跳链路。除此之外还配置了 VARP 当网关用。
    我测试它的冗余性时发现了问题,我是这样测试的:
    禁用主节点上的下行链路,下行交换机的流量能正常转发;
    禁用主节点上的上下行链路,下行交换机的流量能正常转发;
    禁用心跳链路,两端的 Arista 交换机会有告警信息,但下行交换机的流量仍能正常转发;
    再接着,禁用 Peer-Link 链路,主节点已经没有任何联网的地方了,但下行交换机的流量依旧能正常转发。
    但当我直接断掉主节点的电来模拟意外掉线的状况时,意外来了。下行交换机没有任何流量转发到 Arista 交换机上,我用 Wireshark 抓包,Arista 方向有 VARP 的免费 ARP 之类的报文过来,而 Catalyst 方向却没有任何业务流量转发到这条链路上。查看两端的链路聚合端口,是处于启用状态的。而生成树也没有问题,处于转发状态。
    4 replies    2022-10-14 12:07:00 +08:00
    HawkinsSherpherd
        1
    HawkinsSherpherd  
    OP
       Oct 14, 2022
    更新:
    我发现下行的 Catalyst 交换机存在一个诡异的 Bug:除非主动禁用到主节点的接口,否则主节点意外掉电后那台 Catalyst 交换机还会把流量往那边发,手动禁用接口后流量能正常转发。
    Smallsun1231
        2
    Smallsun1231  
       Oct 14, 2022
    Arista 组 MLAG 集群相当于堆叠,逻辑上是一台设备,两块板卡,一台掉电,另外一台正常能用没问题的。
    一台思科上联,不应该是分别到两台 Arista 上选一个口组 port-channel 嘛,咋分别到每天都组一个、。
    Smallsun1231
        3
    Smallsun1231  
       Oct 14, 2022
    每台..
    HawkinsSherpherd
        4
    HawkinsSherpherd  
    OP
       Oct 14, 2022
    @Smallsun1231 对啊,两边的口都组进一个 port-channel ,都是同一个 mlag 组里的。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2984 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 15:02 · PVG 23:02 · LAX 08:02 · JFK 11:02
    ♥ Do have faith in what you're doing.