This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Update failed with HA enabled

Hi,

I have two ASG 320 with HA enabled and the 7.103 firmware on both.
I ran the 7.303 update from the WebAdmin interface and the node 2 (slave) passed on "UP2DATE" status.
The HA log notify that the slave's update failed. Now, the slave stay with the "UP2DATE" status and I can't run an other update. Now, I receive a mail per hour (since 12 hours !!!) which notify :

HA SELFMON WARN: Running during up2date process, aborting! Retry in one hour..

HA Status          : HA MASTER (node id: 1)
System Uptime      : 123 days 12 hours 51 minutes
System Load        : 0.13
System Version     : Astaro Security Gateway 7.103

I think that I have to reboot the slave (It should be hang), but I can't make a manual reboot because I'm far from the datacenter.
Is it possible to reboot the slave by a remote solution ?

Regards.

Trio


This thread was automatically locked due to age.
  • If you have a support agreement, please open a case- we may be able to assist you in a remote reboot of the slave unit.
  • Hi,

    I have the return from the support.

    I can't made a remote reboot of the slave. I have to connect physically to the slave (VGA & USB), log as root and run this command :

    auisys.plx --rpmargs --force

    Infortunately, I don't know the consequence of this command. I have no explanation from the support. Is it to reboot ? To force the update ?

    Have you any idea ?

    Regards.

    Trio
  • The command will force the update and than reboot.
  • Trio, Astaro support in the USA did that remotely for one of our customers.  In which country is this stubborn ASG?

    Cheers - Bob
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • Hi,

    Thanks for your answer. I understand the command now.
    Our ASG is in France.
    Apparently French support can't know how to reboot remotely...

    It's sad ...

    Regards.

    Trio
  • Hi,

    I'm back. I ran the command and reboot three times but the slave is still in 7.202 version ... and in "UP2DATE" status ...

    The master stay with the 7.103 version.
    I don't know what I have to do ...

    1) Upgrade the master on 7.202 to have the same firmwares between master and slave ?
    The problem is that the slave can't become master because is in "UP2DATE" status.
    2) Force the slave on 7.303 version to leave cleanly the "UP2DATE" status ?
    What are the console commands to run the 7.303 update ?

    Have you any solution ?

    Regards.

    Trio
  • I haven't done this exactly as described below, but I did have quite a challenge with a cluster that stalled on both nodes of a cluster going from 7.202 to 7.300.  When you do that Up2Date, you will want to do the temporary load reduction on the Astaro as described below.

    One recent recommendation I've seen is to reduce, temporarily, the load on the Astaro to allow it to complete the upgrade.

    First, do you see the 7.104, 7.200, 7.201 and 7.202 Up2Dates all available on your Master?  If not, download them from Astaro and upload them to the Master.

    Turn off IPS, select 'Single scan' anti-virus scanning for both Web Security and Mail Security.  Turn off logging of any Packet Filter rules.  Turn off HTTP caching.

    Turn off the other node (was Slave) - I guess that it's not handling anything for you at present anyway!

    Now, run on Master the update to latest version.  I don't think you will need to The four Up2Dates will proceed and, after the last reboot of Master, you should be at 7.202 on both machines.

    Once Master is at 7.202, you can turn the other node back on and it should join the Cluster as Slave.

    Bonne chance ! - Bob
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • Hi,

    A big thanks for your detailed solution !!!
    I see all updates on the WebAdmin (7.104, 7.200, 7.201, 7.202).
    I'll do that on a monday night fever...

    The load problem is strange. I'm average of 4% CPU, 38% of 1003MB for RAM and 12 % of 1027 MB for Swap... A low load... 

    I'll give news tuesday... I hope It works !!!

    Regards.

    Trio
  • @Trio
    if u have physikal access to this cluster, maybe this path will be faster:

    Master:
    disable HA/Cluster
    up2date to 7.304

    Slave:
    boot with fresh iso (7.30x) from cd or astaro-stick and install asg
    up2date to 7.304

    Master:
    setup new cluster

    Volia


    Gregor Kemter
  • Hi,

    Thanks for this other solution.
    But, I have a question.
    My appliance (ASG320) can boot with a USB CD Drive ?
    What is the astaro-stick ?

    Regards.

    Trio