This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Stuck in Up2Date over and over

Hi all.  Of my several UTM425 active/passive clusters, one is developing a reputation for being troublesome.  Going back about 2 years, every time I do an Up2Date, one of the units gets stuck in Up2Date; it's not one unit more than the other.  The first time, I opened a ticket, and the tech remoted in and did something that fixed it.  The second time, they advised me to reboot it, and that fixed it.  My strategy the last year or so is to install every Up2Date separately.  I tried opening a ticket about 2 months ago after the 9.11 Up2Date did the same thing.  The tech recommended reinstalling from CD and restoring the config.  When I asked what other options were available, none were proffered.  Eventually it cleared up on its own.  The last Up2Date for 9.201-23 was more troublesome than usual, but a hard reboot fixed it.  Now, the cluster is stuck on 9.201-25.  As usual, the first unit succeeded, and the second unit is stuck.  It's so stuck that a hard reboot won't fix it, and when I tell the stuck unit to reboot through the HA UI, it won't respond.  Any ideas?  The idea of reinstalling from CD just seem so Windows-ish that there should be a better way.
If I sound a little critical of recent Sophos tech support encounters, I think I'm somewhat justified.


This thread was automatically locked due to age.
Parents
  • I assume you and Sophos have looked at the Up2Date log file, and that there were no hints there that you might have a hardware problem on one of the UTMs or between them.

    You can login to the Slave (call it Node 2) at the command line with

    ha_utils ssh


    Then reboot.  Any luck with that?

    If not, then I would disconnect and install Node 2 with a CD, reconnect it and let the Master (Node 1) sync to it.  When the sync is done, force a failover to Node 2 so that you can disconnect Node 1, install with a CD, reconnect and let Node 2 sync to it.

    If you have another Up2Date problem in the future, I would try the install from ISO and config restore.

    Cheers - Bob
Reply
  • I assume you and Sophos have looked at the Up2Date log file, and that there were no hints there that you might have a hardware problem on one of the UTMs or between them.

    You can login to the Slave (call it Node 2) at the command line with

    ha_utils ssh


    Then reboot.  Any luck with that?

    If not, then I would disconnect and install Node 2 with a CD, reconnect it and let the Master (Node 1) sync to it.  When the sync is done, force a failover to Node 2 so that you can disconnect Node 1, install with a CD, reconnect and let Node 2 sync to it.

    If you have another Up2Date problem in the future, I would try the install from ISO and config restore.

    Cheers - Bob
Children
No Data