This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

It all went bang!

I had a weird thing happen today and I am hoping that one of you guys can shed some light on why this might have happened and how I could get out of this kind of problem, should it happen again.

I upgraded to v7.101 two days ago. The only reason I did this was because the things you have to pay for on v6.x are free in v7.x (antivirus etc) and if I wanted to continue with my v6.x ASG I would have been up for the cost of a subscription renewal.
This is the first time I have even looked at v7.x, given that I was very happy with my v6.x installation and its performance and it has been a bit of a time consumer building and reconfiguring my new ASG installation (maybe would have been cheaper and easier to pay for a new v6 subscription)

Sorry, I’m babbling on here; I should get to the point of this post.

I was changing the upstream proxy settings when suddenly things just stopped working.
I saw an email arrive in my mailbox stating “ Middleware not running – restarted”. The WebAdmin then went unresponsive and access to the Internet disappeared. I was no longer able to ping the ETH0 interface either.
After trying a few things I decided to do a hard restart of the ASG box. Even after doing this I was unable to ping the ETH0 interface and, therefore, unable to get to the WebAdmin page. Another thing that I did notice was that the ASG when rebooted did not do its usual three beeps when it was finished loading. I rebooted the ASG another three times but there was no change in the situation.
Luckily I had done a backup last night when I had got most things setup on the ASG. I decided to do a rebuild of the box and use this backup. That worked fine and I am back up and running again but, as I am sure anyone reading this would understand, I am a little concerned that I needed to do a rebuild to fix this problem.

I have read some posts about disjointed lock files but, not being a real Linux person, I did not really have any idea how I would identify if this was the cause of the problem I experienced.

No matter what I tried I was unable to make the ASG pingable.
Does anyone have any helpful hints on how this problem could have been resolved, without the need of doing a rebuild?

This is the first tine in the 5+ years of using Astaro as my firewall that I have had to rebuild the box to get basic functionality back.
A bit scary . . .


This thread was automatically locked due to age.
Parents
  • Hi BigO,

    a colleague just pointed me to this thread.  I'm in charge of V7 MiddleWare
    development and code maintenance.  What you describe in your posting "It
    all went bang" are typical symptoms of a fatal MiddleWare bug.      
    As you are saying, such bugs are very rare, but when they hit, it's typical 
    for the MiddleWare to ruin basic network connectivity, for the SelfMon
    unsuccessfully trying to restart the MiddleWare and for the problem
    to persist even across reboots. 

    Currently, i have one such issue under investigation (internal 
    Mantis issue #7569).  You are talking about changing the upstream 
    proxy settings - this might indicate you are looking at the same issue.
    I will review the details and come back to you for additional 
    information if needed.


    Hi kury,

    what you are telling about your problem is not sufficient to decide
    whether it might be related; in fact, i would rather say it sounds
    different, but that's guesswork.  As apparently you already started 
    working together with our support team, it's probably best to let   
    the support work it out, just supply the info they are asking for to 
    them.  In case our support engineer needs help, he is welcome to 
    contact me internally...

    Yours,
      Ingo
  • Hi BigO,

    your problem had nothing to do with lock files, it was caused by a bug
    in the MiddleWare sp_updater module.  Thank you very much for reporting
    this, together with what one of our support engineers found out, this
    was sufficient to isolate and fix the bug!  I just committed the fix to
    our code repository.  It is scheduled for the next Up2Date (7.102).

    As i said before, i doubt this has anything to do with what 
    kury talked about, though.


    I just wrote the following entry for the Known Issue List:

    Known Issue Text:
    In ASG v7.100 and v7.101, using a DNS host object in
      WebSecurity->HTTP->Advanced->HTTPParentProy->Host
    can kill the MiddleWare if the hostname cannot be resolved.
    This may lead to unstable network connectivity.

    Known Issue Workaround:         
    Until the release of ASG v7.102, only use plain "Host" objects in
      WebSecurity->HTTP->Advanced->HTTPParentProy->Host,
    explicitely specifying the IP address.

    To repair an affected ASG, issue the following command as root:
     # cc set http parent_proxy_status 0
    After that, log into the Webadmin, remove the DNS host object,
    create a new Host object with a static IP address to specify
    the HTTP parent proxy and finally re-enable the checkbox "Use parent proxy".

    Yours,
      Ingo
Reply
  • Hi BigO,

    your problem had nothing to do with lock files, it was caused by a bug
    in the MiddleWare sp_updater module.  Thank you very much for reporting
    this, together with what one of our support engineers found out, this
    was sufficient to isolate and fix the bug!  I just committed the fix to
    our code repository.  It is scheduled for the next Up2Date (7.102).

    As i said before, i doubt this has anything to do with what 
    kury talked about, though.


    I just wrote the following entry for the Known Issue List:

    Known Issue Text:
    In ASG v7.100 and v7.101, using a DNS host object in
      WebSecurity->HTTP->Advanced->HTTPParentProy->Host
    can kill the MiddleWare if the hostname cannot be resolved.
    This may lead to unstable network connectivity.

    Known Issue Workaround:         
    Until the release of ASG v7.102, only use plain "Host" objects in
      WebSecurity->HTTP->Advanced->HTTPParentProy->Host,
    explicitely specifying the IP address.

    To repair an affected ASG, issue the following command as root:
     # cc set http parent_proxy_status 0
    After that, log into the Webadmin, remove the DNS host object,
    create a new Host object with a static IP address to specify
    the HTTP parent proxy and finally re-enable the checkbox "Use parent proxy".

    Yours,
      Ingo
Children