Guest User!

You are not Sophos Staff.

This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

HA and 2 ESXI server L2 problem

Hi

I have a problem. See Image.
I have a active standby Astaro cluster.

When Standby member is shutdown
- Astaro Active is able to ping 1.1.1.2 and 1.1.1.3 
- 1.1.1.2 can ping 1.1.1.3

When Standby member is UP (both are Sync and ready)
- Astaro Active is able to ping 1.1.1.2 but NOT 1.1.1.3
- 1.1.1.2 can ping 1.1.1.3 (so network is OK)
- Astaro Active is sending arp request but 1.1.1.3 is not responding... arp request are not even reaching 1.1.1.3. 

WHY when Standby member is up that the VM on the standby physical server are not reachable. Its probably a HA issue since when standby is shutdown everything is working fine.
THANKS



This thread was automatically locked due to age.
Parents
  • 1)  What version of Astaro are you running?  Someone in the thread at https://community.sophos.com/products/unified-threat-management/astaroorg/f/51/t/21101 had the same issue which was solved up upgrading to Astaro v8.

    2)  Ping in Astaro is controlled in WebAdmin through Network Security>>Firewall/Packet Filter(named differently depending on version)>>ICMP Tab.  I would confirm that these settings are correct and synced.

    3)  If the Standby Astaro was cloned, ensure that the MAC addresses are different than the ones used by the Active Astaro.
  • Hi,

    in our case the problem was that the astaro is using in HA mode one virtual mac address for both of the VM machines.

    So the virtual machines on the ESX(i) host with the passive cluster cannot contact the active cluster because the virtual switch is routing the packets to the passive node.

    I remember that there is a console command to disable this.
    Then the active and the passive node are using there "real" hardware address and the problem could be solved.

    I think you should contact astaro support in this case.

    Greets
    Daniel
  • I am also extremly interested in a solution of this problem, as i am also having the same issue!
  • I had what sounds like basically the same issue--not just ping problems but general problems with VM guests connecting to each other between the two ESX hosts.  I fixed it by putting the ASG LAN interfaces on their own dedicated vSwitch in each ESXi host and then giving that vSwitch a dedicated physical NIC interface connected out to the real network switch. I admit it doesn't seem like the cleanest solution and it may not be practical for everyone if you don't have an additional physical NIC (and switch ports), but it worked for me.  I'm not trunking though, so I can't confirm results on that configuration.  

    And in reference to the v8 comment above, I definitely had the problem in 8.102 because I didn't build the cluster until after I upgraded, so just going to v8 didn't seem to be the solution for me.  I haven't tried the original configuration with either 8.201 or 8.202 though, so something could be different there (the .202 update did fix a number of other issues I was having though).
Reply
  • I had what sounds like basically the same issue--not just ping problems but general problems with VM guests connecting to each other between the two ESX hosts.  I fixed it by putting the ASG LAN interfaces on their own dedicated vSwitch in each ESXi host and then giving that vSwitch a dedicated physical NIC interface connected out to the real network switch. I admit it doesn't seem like the cleanest solution and it may not be practical for everyone if you don't have an additional physical NIC (and switch ports), but it worked for me.  I'm not trunking though, so I can't confirm results on that configuration.  

    And in reference to the v8 comment above, I definitely had the problem in 8.102 because I didn't build the cluster until after I upgraded, so just going to v8 didn't seem to be the solution for me.  I haven't tried the original configuration with either 8.201 or 8.202 though, so something could be different there (the .202 update did fix a number of other issues I was having though).
Children
No Data