This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Strange problem with HA

Hi,
I have a rather strange problem when using HA.

Here is a summary of the environment first: -

2 x HP ML150 G5 running ESXi 4.1.  Both servers have dual NIC's and the physical switch is configured with multiple VLAN's across the ports used by the ESXi servers.  The servers are configured with a DVSwitch with multiple port groups.  One of the port groups is configured for VLAN Trunking with the necessary VLAN ID's.

I have two Astaro installs - one on each physical ESXi server.  They are both configured the same under VMWare to use four NIC's.  NIC1 - internal network, NIC2 - external network, NIC3 - VLAN trunk, NIC4 - heartbeat for HA.  On the VLAN trunk NIC, I have four VLAN's running (DMZ1, DMZ2, VLAN40, VLAN100).  The NIC's are E1000's on both Astaro boxes.  They both have the same RAM, disk, and are running 8.1.

When HA is turned OFF, everything works exactly as it should do - Astaro see's all the VLANs and routes traffic exactly as it should - everything is great [:)].  This applies to whichever ESXi host the VM is running on (I can move it between hosts as I have vMotion configured).

When I turn on HA, that is when it all goes a bit odd.  Node 1 of the Astaro HA is on ESXi-Node1, Node 2 of the Astaro HA is on ESXi-Node2.  When HA is enabled (using automatic), Astaro gets very confused as to what DMZ1, DMZ2, VLAN40 and VLAN100 are.  On Astaro-Node1, it doesn't know what DMZ2 is.  On Astaro-Node2, it doesn't know what DMZ is?  It's the same with VLAN40 and VLAN100.

If I remove HA from the install - everything returns back to normal.

Any suggestions would be welcome.


This thread was automatically locked due to age.
  • What does it show under "High Availability" => "System Status" after turning on HA? Do you see both Machines there? One of them should be in active, the other in syncing state.

    What do you mean exactly with: "it doesn't know what DMZ2 is."?

    Have you tried to factory reset one of the nodes (the one without the current working configuration of course) and let it recreate the HA?
  • Hi Whity,
    When HA is setting up, Node 1 is Master and Node 2 is syncing.  After the sync is complete, Node 2 becomes slave.

    [quote]What do you mean exactly with: "it doesn't know what DMZ2 is."?[/end quote]
    Any server within DMZ2 can ping anything else in DMZ2 with the exception of the Astaro interface.  Similarly, when I try and ping a server in DMZ2, I get either request timed out or destination unavailable.

    If I fail the HA over so that the second node becomes Master, DMZ2 starts responding again and DMZ1 has the same problems as DMZ2 had.  The problem seems to only affect interfaces that are type Ethernet VLAN.

    To eliminate any possible underlying VMware configuration issues, I have run both nodes on the same physical server and the problem is exactly the same.
  • Is spanning tree enabled on the switches? STP can make problems sometimes.
  • STP is enabled.  I will have a look at this when I get home later to turn it off and try again.  Thanks for the suggesting Whity.
  • [quote]Have you tried to factory reset one of the nodes (the one without the current working configuration of course) and let it recreate the HA? [/end quote]

    Sorry - missed this one.  I've rebuilt both nodes from the ground up and applied a brand new config from scratch.
  • Is spanning tree enabled on the switches? STP can make problems sometimes.


    Hey Whity - turned off spanning tree on the switch.

    Enabled HA on Node 1 - everything working OK.  As soon as I enable HA on Node 2 and the Astaro starts to build the HA cluster, I lose access to/from DMZ2 etc.

    Good suggestion and a pity it didn't work.
  • No other idea at the moment, except to contact your reseller or Astaros support (Depending on what license you have)