This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Failover events in an active-passive Cluster

Hi all,

i have 2 nodes (N1, N2) in an active-passive HA (v7.x , the latest version). Heartbeat goes through a dedicated NIC with x-cable. 

Node N1 is connected with several uplinks to Switch1, Node N2 is also connected with the same # of uplinks to Switch2. The 2 switches are trunked, means that the 2 switches have all VLANs shared.

The final question :-)

Node N1 is active, N2 is passive. Switch1 goes offline = all Uplinks on Node N1 are going down. This should be a failover event. Orly? Nope?

If not, how to get it with the least amount of effort? It will be a bunch of trouble to re-cable the whole thing :-/
One idea is (just thinking about that): Connect Heartbeat NIC from Node N1 to Switch1 VLAN99. Also connect Heartbeat from Node N2 to Switch2 in VLAN99 (remember, both switches trunked). If Switch1 goes offline, the heartbeat has gone and Node N2 can do a failover? If Switch2 should go offline nothing happens, because Node N1 is already active.... ? Hm. 

thx all for reading, and much more for good answers :-)


This thread was automatically locked due to age.
Parents
  • Hi, Plustig, and welcome to the User BB!

    I don't think your suggested scenario is your best solution.  It should work if the backup interface for the heartbeat is the Internal interface.

    If you have two switches, I'd suggest using Link Aggregation on the Astaros to allow both units to be connected to both switches.  That's a little extra work, but it would maximize reliability while potentially increasing network throughput.

    Cheers - Bob
  • Hi Bob,
    i agree, it's not one of the best practices... but the situation is more or less fixed ;-) I like the solution to use one of the internal uplinks as backup heartbeat. But isnt the meaning of the backup heartbeat NIC to preserve master master situations if the heartbeat comes back online again? Just to be sure... would the "link down" on backup heartbeat initiate a failover?

    For some guys landing here through google or whatever: Does also my initial idea do the job? I know that i have - if the heartbeat is switched - fix my edge ports to 100 full (no JF available).

    I know... stupid detail questions, but i am really sorry that i have to ask them a little bit late to find some light in a situation full of shadows [8-)] Nice to talk with someone who has detail knowledge [:)]
Reply
  • Hi Bob,
    i agree, it's not one of the best practices... but the situation is more or less fixed ;-) I like the solution to use one of the internal uplinks as backup heartbeat. But isnt the meaning of the backup heartbeat NIC to preserve master master situations if the heartbeat comes back online again? Just to be sure... would the "link down" on backup heartbeat initiate a failover?

    For some guys landing here through google or whatever: Does also my initial idea do the job? I know that i have - if the heartbeat is switched - fix my edge ports to 100 full (no JF available).

    I know... stupid detail questions, but i am really sorry that i have to ask them a little bit late to find some light in a situation full of shadows [8-)] Nice to talk with someone who has detail knowledge [:)]
Children
  • Hi Plustig,

    Node N1 is active, N2 is passive. Switch1 goes offline = all Uplinks on Node N1 are going down. This should be a failover event. Orly? Nope?


    Nope. [:)] The purpose of failover is to survive the failure of one of the Astaro unit's, not the failure of any hardware that may be attached.

    But isnt the meaning of the backup heartbeat NIC to preserve master master situations if the heartbeat comes back online again? Just to be sure... would the "link down" on backup heartbeat initiate a failover?


    As I understood it, The purpose of the backup heartbeat link is so that if for some reason the primary heartbeat link went down but the master is still up, the slave ASG won't become master. If both links were to go down the slave would take over as master.

    As Bob said, the best choice to handle redundant switches is to use link aggregation so the failover from one switch to another is transparent.
  • Hi Drew (the) [:)]

    Thanx for explanation. I tried Bobs idea 1st because it was less work for me. It did the job, so thx @Bob. 

    Link aggregation will need another "active" license i think, not only a base license as in active/passive situations. I have to calculate the costs for the next project to give it a try. But as i agreed before, i think you both guys are right, this is the best practice.

    So the failover events with HA are

    a) Node down
    b) HB down
    c) HB backup down

    Good to know [:P]