This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

active/backup link-aggregation on ASG

Hi everyone

I got two ASG 220 units yesterday to perform some tests and decide, whether they suit our needs or not.

As part of our HA setup, we'd like to connect each ASG to one of our core switches. Using a multi-chassis environment with seperate administrative domains, we will not be able to use 802.3ad and therefore, I tried to use bonding mode 1 (active/backup).

Network design:

  SWITCH 1  ====  SWITCH 2
e0/1    e0/2           e0/1    e0/2
   |           |                  |           |
ASG1    ASG2           ASG1    ASG2
eth0     eth1             eth1     eth0
(pri)      (bkp)            (bkp)    (pri)


How to change LAG mode and setting primary interface using CLI:
cc
OBJS
itfparams
link_aggregation_group
REF_LagOne[...]
mode=1
primary=REF_ItfHwDefaultInternal
w


Here is the output after having issued the changes above:
127.0.0.1 OBJS itfparams link_aggregation_group > REF_LagOne[REF_LagOne,itfparams,link_aggregation_group] 
Logged into object 'REF_LagOne'. Use 'w' to write eventual changes.
{
 'use_carrier' => 1,
 'mode' => 1,
 'status' => 1,
 'primary' => 'REF_ItfHwDefaultInternal',
 'updelay' => 0,
 'arp_interval' => 0,
 'id' => 0,
 'miimon' => 0,
 'enforce_mac' => 0,
 'xmit_hash_policy' => 'layer2',
 'name' => 'REF_LagOne',
 'itfhw' => [
              'REF_SwQSJNTgDn',
              'REF_ItfHwDefaultInternal'
            ],
 'comment' => '',
 'ad_select' => 0,
 'arp_ip_target' => '0.0.0.0',
 'downdelay' => 0,
 'lacp_rate' => 1
}


Long story short:
The failover simply doesn't work. Tried deactivating use_carrier and going back to MIImon (100ms) with no luck. Funny thing is, that it even ignores the primary interface (set to eth0) and instead uses eth1 as primary.
Does anyone of you guys have a running LAG in active/backup configuration?

Cheers,
gartoffel


This thread was automatically locked due to age.
Parents
  • Hi gartoffel,

    please try the following Middleware RPM for 8.103, which should fix the issue:
    ep-mdw-8.10-13.gea3ce5a.i686.rpm
    Install with "rpm -U --force ep-mdw-8.10-13.gea3ce5a.i686.rpm" and restart you system.

    Cheers
     Ulrich
  • Hi Ulrich

    please try the following Middleware RPM for 8.103, which should fix the issue

    Sorry, that it took me so long to get back to you. I had to perform several tests first and came across some rather strange behavior. That's why I'm still sitting in the lab after hours to make sure you can reproduce the bug...

    Test environment
          Switch
    
    port 1    port 2
       |             |
       |             |
    eth0       eth1
         ASG 220


    Primary lag0 interface is set to eth0. No further changes through cc.

    Test procedure
    1. Plug in both cables
    2. Plug out the cable of eth1 (no ping loss)
    3. Plug it back in (no ping loss)
    [You can repeat steps 2 and 3 as long as you want without further consequences. This is due having declared eth0 as primary interface] 
    4. Plug out the cable of eth0 (lost 500ms of ping)
    5. Now plug the cable of eth0 back IN (lost 40-75 seconds(!!) of ping)
    [This can be reproduces many times in a row. The timeouts vary, but I didn't find out on what it depends. Average is about 60 seconds.]

    I tested several things, but I'm pretty sure that the only way to solve this issue is to sniff using Wireshark and see whether the gratuitous ARP are being sent or not. For me, that's the only thing that makes sense.

    What do you think?

    Cheers and good night,
    Manuel
Reply
  • Hi Ulrich

    please try the following Middleware RPM for 8.103, which should fix the issue

    Sorry, that it took me so long to get back to you. I had to perform several tests first and came across some rather strange behavior. That's why I'm still sitting in the lab after hours to make sure you can reproduce the bug...

    Test environment
          Switch
    
    port 1    port 2
       |             |
       |             |
    eth0       eth1
         ASG 220


    Primary lag0 interface is set to eth0. No further changes through cc.

    Test procedure
    1. Plug in both cables
    2. Plug out the cable of eth1 (no ping loss)
    3. Plug it back in (no ping loss)
    [You can repeat steps 2 and 3 as long as you want without further consequences. This is due having declared eth0 as primary interface] 
    4. Plug out the cable of eth0 (lost 500ms of ping)
    5. Now plug the cable of eth0 back IN (lost 40-75 seconds(!!) of ping)
    [This can be reproduces many times in a row. The timeouts vary, but I didn't find out on what it depends. Average is about 60 seconds.]

    I tested several things, but I'm pretty sure that the only way to solve this issue is to sniff using Wireshark and see whether the gratuitous ARP are being sent or not. For me, that's the only thing that makes sense.

    What do you think?

    Cheers and good night,
    Manuel
Children
No Data