Guest User!

You are not Sophos Staff.

This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

WAN failure when doing xen migration?

So I'm trying to set up a config with two xenservers in a pool.  Migration of guests from one server to the other should go almost seamlessly.  For all but one, it does.  That is the ASG for my internet.  In fact, the LAN *does* switch okay, but the WAN never comes up.  Going to the dashboard shows "State Up", but "Link Error".  Even if I migrate back to the original server, it stays down, and I have to reboot the ASG VM.  This is obviously not acceptable for an HA setup [:(]  I am doing it this way, since I can't afford the ASG HA license.  Does anyone have any clue as to what is going on?  This is 100% reproduceable...


This thread was automatically locked due to age.
  • Hi, I'll let someone else answer your XEN questions, but fyi, you don't need a special license for a 'hot standby' / passive HA setup.

    Only the Active/Active clustering needs licenses for each device.

    Barry
  • really.  for some reason i had thought it worked that way.  maybe i'll give the active/passive a try.  thanks!
  • The xentools issue turned out to be uglier than i thought.  It even hoses the VM if you are just migrating the vhd to a different disk on the same server!  It's something specific to ASG (and in fact specific to the WAN interface on the ASG), since none of the other apps have an issue with migration and they are all running xentools too.  Even weirder: the ASG LAN interface comes thru just fine, just the WAN that gets borked.  When doing either a VM migration or storage migration, the tools do something that causes a blackout of about 1 second at the end, and that seems to be what is causing a fatal error on the WAN interface (needed to be recovered by a reboot.)
  • My guess is that you would need to clear the ARP table in the router/switch the WAN NIC is connected to.  Then again, it's not clear to me why the reboot solved the problem, but, since it did, maybe a Disable/Enable of the WAN interface would fix the problem.

    Still, the best solution is Hot-Standby.

    Cheers - Bob
  • The thing is: it isn't just that there is no connectivity, but that the link status says "Error" (have been unable to find out what that means...)  And yes, weird that a reboot 'fixes' it.  I agree, Hot-Standby sounds like the ticket.  I won't be able to play with this until later tonight, when my wife is done working.  This hang didn't help the WAF at all [:)]
  • BTW, you didn't state your ASG/UTM version #.

    Barry
  • Sorry, my bad.  It's 9.005-16.
  • I haven't had a chance to try this yet, but I'm looking for an answer to this: I understand that if the master is not responding to heartbeat, the slave takes over.  Are there any circumstances where the master will abdicate?  e.g. in my above case, the master's WAN link goes to 'error' state and I am off the air.  Will this cause a failover?  If not, it won't do me any good.
  • Are there any circumstances where the master will abdicate? e.g. in my above case, the master's WAN link goes to 'error' state and I am off the air. Will this cause a failover?

    No, it won't, but it wouldn't make any difference if it did.  Depending on your configuration and concerns you might need an answer with Uplink Monitoring or Uplink Balancing.

    Cheers - Bob
  • Thanks Bob.  Not sure I'm understanding you.  Currently both virtualization hosts have 2nd nics connected to the fiber WAN link (dhcp based), and I've always used uplink monitoring anyway.  What did you mean by 'might need an answer'?