Guest User!

You are not Sophos Staff.

This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Keep Node(s) Reserved During Up2Date - OK for one node? How many of you use this?

Greetings all.

I am running the software appliance in HA mode on two identical Dell Poweredge 2650 servers.  I am currently on 9-309-3 and have 9.310-11 waiting to be installed on the system.  I am new to the whole HA setup, having just recently made the jump to two physical servers from a single server instance under VMWare (where I had the safety net of snapshots to save me from upgrades gone bad).

I see that there is the option in the HA settings to "Keep Node(s) Reserved During Up2Date", but reading the docs it makes it seem like this is better suited for multiple HA nodes.  Do any of you running a SINGLE two-server HA node use this feature?  I thought I saw somewhere in a post that it was causing issues  (of course I cannot find that now when I search).

I would just like to hear if anyone successfully updates with this feature on without problems with a single Active-Passive HA node, or do I just grit my teeth and go for it and upgrade the "standard" way.


This thread was automatically locked due to age.
  • Hi Scoobmaster, 

    I myself prefer that option because it provides me with easy revert-back procedure to old firmware version by just turning off the Master node. Up2date of Hot-Standby (Active/Passive) cluster should look like this:

    1. UTM2 (Slave node) is updated first. After restarting this node will be promoted to Master role and UTM1 (ex Master) would be downgraded to Slave role in RESERVED (no syncing) state:


    2. If everything works fine after a day or two of production testing, "Upgrade Node" option will apply firmware update to UTM1 node (UP2DATE status):


    3. UTM1 reboots and starts syncing all of the changes from UTM2. This should take no more than 5 minutes:


    4. At the end, both of the nodes should be in READY/ACTIVE status: 


    Hope that this helps...
  • Yes, that explains it all quite well.  Thanks!
  • there is a disadvantage: a reserved node does not sync config changes...
  • a reserved node does not sync config changes
    Correct.  Until the units are back on the same version, they really aren't working in HA.  Reserved Mode is meant to be used temporarily, while you check everything is ok with the node that has been upgraded.
    __________________
    ACE v8/SCA v9.3

    ...still have a v5 install disk in a box somewhere.

    http://xkcd.com
    http://www.tedgoff.com/mb
    http://www.projectcartoon.com/cartoon/1
  • Hi,

    I faced some strange behavior with smtp proxy when using reserved node.
    Quarantäne mails are not accessabile.

    I only use the feature for 1-3 hours, after that I up2date the slave.


    Attention: when you try to do an up2date to a reserved cluster state, the slave is getting the update and your config ist lost.

    Sven

    Astaro user since 2001 - Astaro/Sophos Partner since 2008

  • Rollback procedure:

    1. Shutdown the node that was first upgraded (UTM2, now acting as a Master). This will automatically promote UTM1 to cluster Master role:


    2. UTM2 will be listed with the Status of DEAD, and should be removed from the cluster:


    At that point, UTM2 device should be reinstalled and rejoined to the cluster again as soon as possible. Before every cluster update procedure, just in case, prepare this things in advance (will save you a lot of time in the worst case scenario):

    • VGA monitor for supervising the installation procedure.
    • USB keyboard. Not really necessary, but can speed up the installation procedure for a minute or two by just hitting twice on the ENTER key..[;)]
    • External DVD reader and proper USB cables (with two USB jacks on the UTM side of connection).
    • DVD media inserted with UTM firmware version that was actual before the upgrade procedure (same as on UTM1 in this example).
  • A rollback causes the loss of any changes made on the Up2Dated unit including emails quarantined since the Up2Date took place and any undelivered emails in the SMTP Spool.  I've not used the "Reserved node" capability with any customer nor in the lab.  Is there anything other than config changes and email that should be checked before rolling back?

    Cheers - Bob
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • I see some more valuable information has been added.  Thanks to all for your replies and participation in the discussion.  I am now a little paranoid as it seems there could be more harm than good done here if things don't go right?  I have performed one up2date since going to HA with two physical servers and it went fine.  I am torn as to just keep doing it that way (status quo) or to switch to the reserved node method.  It seems that more users DO NOT use the reserved node than do. 

    BAlfson:  You never use this method in production?  Has an up2date on a HA node ever failed you or gone "wonky"?
  • I'm sorry, if I was the reason...

    But let's re-think the options in case of an up2date-failure:

    NOT using a reserved node:
    Your system is down.
    You loose quarantined mails, logs and reports.

    Using a reserved node - immediate failure:
    You only loose a slave node and your system keeps working.

    Using a reserved node - up2date successful with critical bugs in the new version:
    Shutdown the node with the new version.
    Your system is working again.
    You only loose config changes, quarantined mails, logs and reports from the point the new version node got master to the point you shutdown this node.
    But this won't be a big problem, because you can separate the problem node from your network and start it standalone to get what you need before re-installing

    So, using a reserved node is like using a snapshot...
Share Feedback
×

Submitted a Tech Support Case lately from the Support Portal?