This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Best/Safest Method to Upgrade to 7.4 w/HA

Hi Fellas:

I have two ASG 425's in HA mode that I want to upgrade from 7.3 to 7.4.

What would be the proper procedure to upgrade these devices and be able to fallback to version 7.3 if I run into major issues?

I understand that I just run the upgrade from the console and it will upgrade both automagically but what is the procedure to fallback other than restoring from backup.

If I do have to restore from backup, how would I accomplish this in a HA configuration?

Thanks!


This thread was automatically locked due to age.
Parents
  • King, if you've seen my posts about this upgrade, you already know that I'm in favor of holding off in high-profile environments.  But here's a plan adapted from one I originally made to do a manual 7.202-7.300 upgrade with a client that has two ASGs in a cluster.

    Obviously, you need to have downloaded the ISO and necessary Up2Dates.

    [LIST=1]
    • Download several unencrypted backups and put the most-recent one on a USB stick.  Scrape any needed logs if they aren't already safe in a remote archive or on a remote syslog server.
    • Allow the upgrade to occur.
    • When the decision is made to roll back, inform the users that you are going to erase most of the quarantine and force delivery of the remaining emails.  They might get some spam, and they will lose any email that's been in quarantine longer than X hours.
    • When you are ready to begin the roll-back, shutdown the slave.
    • Disconnect all Ethernet cables from the slave.
    • Connect a USB CDROM with the appropriate Astaro boot CD, then power up the slave.
    • After the CD has loaded and is ejected, power down the slave.
    • Insert the USB stick with the unencrypted backup, and power up the slave.
    • Connect a PC to the Internal port to upload and apply any Up2Dates.
    • Disconnect the master from the WAN, then apply your email policy by forcing delivery of non-malware quarantined in the last X hours (#3 above).
    • The slave is now down-level from the master.  Leave it on, but still disconnected.  Power down the master.  Plug the Ethernet cables back into the slave.  The slave will see that it is alone, so it will become master.
    • If you have had to do this suddenly, then there might be some ham left in the quarantine, so you might want to wait a day or two for special requests to release emails older than X hours.  To do this, first make sure you have removed your internal mail server from host-based relays on the disconnected unit.  Disconnect the internal interface of the active device, and connect the old master's internal interface so you can force delivery of email without worrying about the mail server trying to relay through it.
    • When you are ready, apply steps 4 through 7 to the old master (restoring the backup is unnecessary), reconnect it and power it up.  It will become the slave and the new master will mirror to it.
    [/LIST]
    That's what worked for me in a similar situation.  If I were to do it again, I'd move the log scraping into step 12.  Also, this was done after hours, so we didn't do the host-based relay trick in step 10; it was an oversight not to have done it then instead of in step 12.

    Cheers - Bob
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • Hi All, 
    there is an even safer and faster way.

    1) create a backup and store it off box.
    2) if important, store logfiles off box (just in case)
    3) turn the slave machine off and leave off.
    4) update master unit and test if everything is working as expected. 
    With 7.400, please let the box run 1 day to make sure, as we do the 
    database conversion in the background once we rerelease 7.400. 
    This can take a view hours. If reporting is not that important to you, 
    you can lower the retention period on how long you keep reporting data. 

    Now you can decide if 
    a) 7.400 is running fine - continue upgrade

    5) start the slave node again and wait. 
    The node will automatically detect that the master has the newer version, 
    it will download and install it automatically to match the master, 
    after that it will resync the whole configuration and database.
    6) done


    b) if 7.400 is not working as you expect do:

    5) shutdown master
    6) start slave which still has 7.306 and all logfiles, reports and quarentine
    7) disconnect the 7.400 unit from the network
    8) reinstall 7.306 from CDROM or the Astaro Smart installer and shutdown.
    9) reconnect the reinstalled box to the network and the HA and start it. 
    It will now also sync again the time, config, database, logfile and 
    reporting from the master.


    this way you should not loose logfile, reporting or quarentine. 

    I hope that helps, 
    regards
    Gert
  • this is a concrete proposal! i will use this way to upgrade asg´s in ha environments.
  • Agreed.  Thanks, Gert, that's a better approach if one is concerned that the new version won't work.  My plan was for a situation where we needed to get onto the next version, had to do a manual reload and wanted to minimize downtime and data loss.  Your solution is more elegant for the current queston.

    Cheers - Bob
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • Wow, now I'm really glad I asked - good write-up!

    Thanks again...
  • Could I vpn(using the Astaro pptp) into my network, and access the WebAdmin console to power down my second unit? Then could I apply apply the firmware update?
  • Hi All, 
    there is an even safer and faster way.

    1) create a backup and store it off box.
    2) if important, store logfiles off box (just in case)
    3) turn the slave machine off and leave off.
    4) update master unit and test if everything is working as expected. 
    With 7.400, please let the box run 1 day to make sure, as we do the 
    database conversion in the background once we rerelease 7.400. 
    This can take a view hours. If reporting is not that important to you, 
    you can lower the retention period on how long you keep reporting data. 

    Now you can decide if 
    a) 7.400 is running fine - continue upgrade

    5) start the slave node again and wait. 
    The node will automatically detect that the master has the newer version, 
    it will download and install it automatically to match the master, 
    after that it will resync the whole configuration and database.
    6) done


    b) if 7.400 is not working as you expect do:

    5) shutdown master
    6) start slave which still has 7.306 and all logfiles, reports and quarentine
    7) disconnect the 7.400 unit from the network
    8) reinstall 7.306 from CDROM or the Astaro Smart installer and shutdown.
    9) reconnect the reinstalled box to the network and the HA and start it. 
    It will now also sync again the time, config, database, logfile and 
    reporting from the master.


    this way you should not loose logfile, reporting or quarentine. 

    I hope that helps, 
    regards
    Gert




    I need a little help here. I followed these directions. I installed 7.402 on ASG 320 last Friday. Today I decided to turn on the slave to get it up to date and establish my HA cluster again. When I turned on the second ASG 320, it boots. It displays that it has firmware 7.306. I get a message on the lcd that reads "HA DEACTIVATED Node 0 Error". The next message on the display reads "HA MTU ERROR Shuttong Down" Any clues??
Reply
  • Hi All, 
    there is an even safer and faster way.

    1) create a backup and store it off box.
    2) if important, store logfiles off box (just in case)
    3) turn the slave machine off and leave off.
    4) update master unit and test if everything is working as expected. 
    With 7.400, please let the box run 1 day to make sure, as we do the 
    database conversion in the background once we rerelease 7.400. 
    This can take a view hours. If reporting is not that important to you, 
    you can lower the retention period on how long you keep reporting data. 

    Now you can decide if 
    a) 7.400 is running fine - continue upgrade

    5) start the slave node again and wait. 
    The node will automatically detect that the master has the newer version, 
    it will download and install it automatically to match the master, 
    after that it will resync the whole configuration and database.
    6) done


    b) if 7.400 is not working as you expect do:

    5) shutdown master
    6) start slave which still has 7.306 and all logfiles, reports and quarentine
    7) disconnect the 7.400 unit from the network
    8) reinstall 7.306 from CDROM or the Astaro Smart installer and shutdown.
    9) reconnect the reinstalled box to the network and the HA and start it. 
    It will now also sync again the time, config, database, logfile and 
    reporting from the master.


    this way you should not loose logfile, reporting or quarentine. 

    I hope that helps, 
    regards
    Gert




    I need a little help here. I followed these directions. I installed 7.402 on ASG 320 last Friday. Today I decided to turn on the slave to get it up to date and establish my HA cluster again. When I turned on the second ASG 320, it boots. It displays that it has firmware 7.306. I get a message on the lcd that reads "HA DEACTIVATED Node 0 Error". The next message on the display reads "HA MTU ERROR Shuttong Down" Any clues??
Children
  • Is it possible that you have not yet activated HA on the Master?
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • Is it possible that you have not yet activated HA on the Master?



    Ummmm... Ok, I just checked to make sure it was enabled. It was. The odd thing is this is what it shows the status of the currently active asg.

    System status
    System is currently in operation mode: HA
    ID Role Device Name Status Version Last Status Change
    1 MASTER Astaro1 UP2DATE 7.306 Thu Apr 30 09:32:16 2009


    But...... Under the dashboard it indicates the firmware is up to 7.402?????
  • whatever happened with that - did you end up re-installing the slave from scratch?