This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Update failed with HA enabled

Hi,

I have two ASG 320 with HA enabled and the 7.103 firmware on both.
I ran the 7.303 update from the WebAdmin interface and the node 2 (slave) passed on "UP2DATE" status.
The HA log notify that the slave's update failed. Now, the slave stay with the "UP2DATE" status and I can't run an other update. Now, I receive a mail per hour (since 12 hours !!!) which notify :

HA SELFMON WARN: Running during up2date process, aborting! Retry in one hour..

HA Status          : HA MASTER (node id: 1)
System Uptime      : 123 days 12 hours 51 minutes
System Load        : 0.13
System Version     : Astaro Security Gateway 7.103

I think that I have to reboot the slave (It should be hang), but I can't make a manual reboot because I'm far from the datacenter.
Is it possible to reboot the slave by a remote solution ?

Regards.

Trio


This thread was automatically locked due to age.
Parents
  • If you have a support agreement, please open a case- we may be able to assist you in a remote reboot of the slave unit.
  • Hi,

    I have the return from the support.

    I can't made a remote reboot of the slave. I have to connect physically to the slave (VGA & USB), log as root and run this command :

    auisys.plx --rpmargs --force

    Infortunately, I don't know the consequence of this command. I have no explanation from the support. Is it to reboot ? To force the update ?

    Have you any idea ?

    Regards.

    Trio
  • Hi,

    My appliance (ASG320) can boot with a USB CD Drive ?
    What is the astaro-stick ?
    Trio


    You can boot from either an external USB CD drive or an ASI (Astaro Smart Installer).  The ASI is a USB thumbdrive which emulates an external CD drive (as opposed to common thumbdrives, which emulate an external hard drive).

  • ...
    I'm not sure why Gregor suggests stopping the cluster
    ...


    The reason is :

    Between 7.1xx and 7.3xx alot of changes was made inside internal database, which holds all settings. (Also the DB engine was exchanged)

    If you create a new cluster, the slave will recieve clean data from master.
    In case of resync, master and slave have to resync and recheck all data. And at this point i am not sure if Astaro has made their home work.

    regards 

    Gregor Kemter
  • Thank you, Gregor.

    I often repeat the old observation, "Just because I'm paranoid doesn't mean they're not out to get me!"

    I had the 7.202-->7.300 upgrade fail at a client site with a cluster of two ASG220s.  After waiting for a week for the second node to upgrade, I drove 60 miles to the site to load from a CD.  I was unsure of the sequence of disconnecting cables and shutting down the cluster, so I just pulled the plug on the second node.  After I loaded it from the CD, I turned it off, plugged everything in and turned it on again.  I felt lucky that everything worked.

    So, I agree with your concern about the updating process.  I have never turned clustering off.  What does the slave do then?  Does it do nothing, or does it think it's the new Master and light up the ethernet interfaces?  From what you say, I guess that I was wrong to worry that un-clustering a system in use might create duplicate IP addresses both internally and externally.

    Cheers - Bob
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • Hi,

    I'm back with two ASG updated (almost ...) !!!

    I identify the problem.

    First, I think that's better to make a regular update. It's not great to wait a lot of updates !!! Isn't it ? Because when you update a node, the big difference between nodes causes a HA failure. The updated node (which is the slave when you make an update by the WebAdmin) is stucked because of the difference of firmware with the master. But I Have a question.
    If there is a 7.305 firmware, the two ASG are on 7.304, if I update one node (the slave by WebAdmin), at the reboot, It hasn't the same firmware of the master. Will it stucked ? Or is just when the difference is big ?

    Second, when you are in HA mode, the slave don't download the firmwares !!!
    Shame on me ... I didn't know ... The better solution is to reboot the master (I think that's the single solution to switch slave to master), download the update and upload the update to install it.

    Third, I don't have the window to show the update processing. Is it a bug of the WebAdmin ??? A screen plugged on the ASG solve the problem. But remotely, this window will help me.

    Unfortunately, I have a last problem. The pattern don't update. The current pattern version is at 8475 but the latest available pattern version is at 8566.
    Have you an idea ?

    Regards.

    Trio
  • Make sure that your licensing is up-to-date.
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • You will only get patterns for features which are both licensed and active- so you may not always be at the latest pattern.  So, as Bob suggested, check you licensing- then look at what you have active.
  • Hi,

    I have gold to july 2009.
    I don't have web filtering, email filtering, email encryption.
    I only have HA enabled.

    It could be the reason ...

    Regards.

    Trio
  • Without those subscriptions and if you aren't using IPS, then you may be as current as you should be.
  • Hi,

    On my ASG Dashboard, I only have Firewall active, HA active and Intrusion Protection active with 5149 of 7747 patterns (that's the exact message).
    It should be normal... But is it possible to run a manual pattern's update with a command ?

    Regards.

    Trio
  • It looks like you are current with patterns, as it sounds like IPS is the only pattern you should be using and IPS hasn't had a pattern update in many days.

    If you want to force the ASG to check for available downloads, disable automatic pattern updates, wait a moment, then re-enable them- that should launch a fresh download.  Wait ten minutes or so and look at the up2date log, that should tell you if there is a problem.
Reply
  • It looks like you are current with patterns, as it sounds like IPS is the only pattern you should be using and IPS hasn't had a pattern update in many days.

    If you want to force the ASG to check for available downloads, disable automatic pattern updates, wait a moment, then re-enable them- that should launch a fresh download.  Wait ten minutes or so and look at the up2date log, that should tell you if there is a problem.
Children
  • Hi,

    You're right. I have those logs :

    2008:10:29-11:17:01 (none) audld[31208]: Starting Up2Date Package Downloader (Version 1.57) 
    2008:10:29-11:17:02 (none) audld[31208]: id="3701" severity="info" sys="system" sub="up2date" name="Authentication successful" 
    2008:10:29-11:19:01 (none) auisys[31454]: Starting Up2Date Package Installer (Version 1.65) 
    2008:10:29-11:19:01 (none) auisys[31454]: Searching for available up2date packages for type 'ips' 
    2008:10:29-11:19:01 (none) auisys[31454]: id="371D" severity="info" sys="system" sub="up2date" name="No up2date packages available for installation" status="failed" action="install" package="ips" 
    2008:10:29-11:19:01 (none) auisys[31454]: Searching for available up2date packages for type 'ohelp' 
    2008:10:29-11:19:01 (none) auisys[31454]: id="371D" severity="info" sys="system" sub="up2date" name="No up2date packages available for installation" status="failed" action="install" package="ohelp" 
    2008:10:29-11:19:02 (none) auisys[31454]: Searching for available up2date packages for type 'man-app' 
    2008:10:29-11:19:02 (none) auisys[31454]: id="371D" severity="info" sys="system" sub="up2date" name="No up2date packages available for installation" status="failed" action="install" package="man-app" 
    2008:10:29-11:19:02 (none) auisys[31454]: id="3716" severity="info" sys="system" sub="up2date" name="Up2date Package Installer finished, exiting" 

    I think that's all great.

    Regards.

    Trio