Guest User!

You are not Sophos Staff.

This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Link Aggregation Modes

Hello

Trying to solve a problem which is a bit strange.

I have an ASG 120 with a LAG including Interfaces eth1 and eth2. Eth1 goes to Switch #1, eth2 goes to Switch #2. Switch #1 and switch #2 are connected to each other with a trunk. (Switches are two HP ProCurve 2510G-24)

Now, per default, the LAG mode of the ASG is set to 4 (802.3ad). But because mode 4 is only supported when the links go to the same switch, i changed the mode to 6 (balance-alb) which seems to be the right one for this setup (no switch support needed).

Changed it in cc: OBJS ==> iftparams ==> link_aggregation_group ==> REF_LagOne[...]
Saved the change and rebooted the ASG.

For testing i'm pinging both switches from the network on eth0 (internal LAN).

As long both links are connected, everything works fine.

Disconnecting the link to switch #2, it sometimes works just fine with only 1 or 2 pings lost. But sometimes takes 8-25 pings until both switches are reachable again.

Disconnecting the link to switch #1, it totally fails. Switch #1 is not reachable. Switch #2 looses some pings, is reachable again for about 20-25 seconds, an then also stops responding.

First thought about spanning tree or an other switch config, but STP is enabled only on ports witch are connected to other switches and no topology change is visible one the switches.

Compared the configurations of both switches, but both are absolutely identical, except the ip address of course.

Also replaced the ethernet cables, but still the same behavior.


Then started some testings with different LAG modes:

Mode 0 (balance-rr):
Works, but looses some pings from time to time as long both links are connected.

Mode 1 (balance-backup):
Does not work at all. As soon the link to switch #1 (active link) is plugged out, it does not failover to the second link.

Mode 2 (balance-xor):
Seems to work fine.

Mode 3 (balance-broadcast):
Not tested.

Mode 4 (802.3ad):
Works fine.

Mode 5/6 (balance-tlb/balance-alb):
As described above.


So, it looks like all modes which are made to work without any switch support (balance-backup, balance-tlb, balance-alb) don't work at all.

But (almost) all modes which need to have switch support, or better, need to be connected to the same switch to work (balance-rr, balance-xor, 802.3ad) are working just fine.

I'm a liiiiiittle bit confused...

I have a bit a bad feeling running it in a mode which normally needs to connect both links to the same switch, or switches which have support for LAG over multiple switches (SMLT).

Does anyone has some more experience with LAG modes and can tell my what i should do?

Thank you
Urs


This thread was automatically locked due to age.
Parents
  • Hi Whity,

    only 802.3ad requires switch support. And if there is no switch support detected,
    802.3ad has a fallback mode to work even then...

    The original 802.3ad standard was only designed to work with all links going
    over the the same switch. But all vendors created their own extensions, to
    support LAGS going over multiple switches, which have to be connected to each other.

    If both switches are from the same vendor, this should work.
    But this also depends on the switch port configuration...

    For testing: Can you ping a remote node instead of the switch IP addresses
    and clean the ARP tables on the ASG and the remote side after switching the LAG mode?
    Maybe this caused the trouble...

    Cheers
     Ulrich
Reply
  • Hi Whity,

    only 802.3ad requires switch support. And if there is no switch support detected,
    802.3ad has a fallback mode to work even then...

    The original 802.3ad standard was only designed to work with all links going
    over the the same switch. But all vendors created their own extensions, to
    support LAGS going over multiple switches, which have to be connected to each other.

    If both switches are from the same vendor, this should work.
    But this also depends on the switch port configuration...

    For testing: Can you ping a remote node instead of the switch IP addresses
    and clean the ARP tables on the ASG and the remote side after switching the LAG mode?
    Maybe this caused the trouble...

    Cheers
     Ulrich
Children
No Data