This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

UTM(Web Server Protection) High Availability Cluster failing

Hi All,
We've had UTM for several months now, purchased as a replacement for TMG though it hasn't ever worked properly.

We have two virtualised (VMWare) UTM boxes in an Active /Passive cluster. Intermittently all sites published via the boxes fail. Pinging the the Web servers from the UTM console can show intermittent packet loss one second then a full ping the next.

To resolve this, we have to reboot the Active node, which makes the Passive node the master, then after the reboot, the master node is active again, and everything is fine..... Until the next time the Master node decides to stop serving websites.
The last thing Sophos asked us to do was change the drivers from vmxnet3 to e1000 which provided some stability for a few days, then the issue came back. 
Has anyone seen anything like this before in a VMWare environment with Clustered UTM boxes?

(Forgot to mention if we power one of the boxes down, the other box works fine and we never get an error)
Cheers


This thread was automatically locked due to age.
  • Hi, and welcome to the User BB!

    If you search here, you'll see that the VMXNET3 drivers are to be preferred.  I wonder if this isn't a combination of things.  Do the suggestions in  https://community.sophos.com/products/unified-threat-management/astaroorg/f/52/t/27886 help?

    Cheers - Bob
  • Especially for esxi please also check whether you have Mac spoofing allowed in esxi nets
    I recommend using in sophos utm virtual Mac addresses for your local nics to avoid issues on this front
    A last check is an esxi config of the vm where you can disable the Mac recognition and false routing on esxi hosts if you have 2 utms using the same virtual nic Mac.
    You will find here in the forum many Tipps for utm on esxi so give a search a try

    Sorry for being short but I'm on mobile device