This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

[6.303] Very unstable since update, 5 crashes in 24 hours

Since updating to 6.303 (not the reloaded one) we have one firewall which has crashed 5 times in the past 24 hours since the update.

I don't have the exact error message (the fw is not next to me so I have to have the message relayed), but the screen will say something like "not synchronizing" and "fatal error".

The machine has 2 e1000 nics, 2 8129 nics and an e100 nic.

Anyone else seeing something like this? I've seen plenty of other problems with 6.303, but nothing quite like this. Out of 5 firewalls running 6.303 (not the reload) this is the only one with problems so far...

In the mean time we are going to try putting a switch between the external nic/router and if that doesn't work luckily we have spare hardware we can load a backup onto.


This thread was automatically locked due to age.
  • Just did what was suggested in an esrlier post on this thread and the system behaved in a very similar way to the original upgrade in that it stopped part the way through the reboot cycle and had to be manually rebooted.

    Something that I think has only started since 6.303 was installed is this in the kernel log. It doesn't show up during the build until after 6.303 is installed

    2006:09:16-10:24:30 (none) kernel: HTB init, kernel part version 3.17
    2006:09:16-10:24:30 (none) kernel: HTB: quantum of class 20001 is big. Consider r2q change.
    2006:09:16-10:24:30 (none) kernel: HTB: quantum of class 20008 is big. Consider r2q change.
    2006:09:16-10:24:30 (none) kernel: HTB: quantum of class 20003 is big. Consider r2q change.
    2006:09:16-10:24:30 (none) kernel: HTB: quantum of class 20005 is big. Consider r2q change.
    2006:09:16-10:24:30 (none) kernel: Ingress scheduler: Classifier actions prefered over netfilter

    I am running the 2.6.10-58-default version.
  • When the fw fails to reboot, do you see anything on the console?
  • Yes, it gets as far as checking the drives or disks can't remember which it is in blue.
    System stopped about an hour ago, stopped processing anything using the virus/proxies. I couldn't logon via the console to find out what is happening.

    Rebooted, looked in the logs and the only thing I can find is this in up2date report that might be relevant. I have the full set of virus/spam updates active (paid for).

    2006:09:16-12:32:45 (none) pattern_install[8746]: Pattern Up2Date failed: Kaspersky Virus Protection Pattern chroot is missing
    2006:09:16-12:32:45 (none) pattern_install[8746]: Pattern Up2Date: type='', status='failed'
    2006:09:16-12:32:46 (none) pattern_install[8746]: Pattern Up2Date exiting: 

    2 of my eth cards are e1000.

    This time I have root logged on running "top" to see if I can catch what ever it is.

    Looks like tomorows job is re-build it back to 6.302

    Ian M
  • Sounds like your system is seriously borked.
  • That is after a fresh install from 6.300 iso and add each update. The current install is only a day old. This has only happened since 6.303 was installed.

    Looks like the cure is worse than the disease.

    Ian M
  • I checked using the "uname -a" command.. I am running the 2.6.10-57-default version. Is there any way to upgrade to the 2.6.10-58 version without doing a reinstall and repatch?
  • Log into the console, edit (via vi) the /etc/version file.. set it back to 6.302.  Re-run the System Up2Date prefetch via Webadmin, then install.

    CTO, Convergent Information Security Solutions, LLC

    https://www.convergesecurity.com

    Advice given as posted on this forum does not construe a support relationship or other relationship with Convergent Information Security Solutions, LLC or its subsidiaries.  Use the advice given at your own risk.

  • I don't know what has been going on with Astaro lately but their recent patches have been very shoddy.  This is very unfortunate as their products are promising.
  • Log into the console, edit (via vi) the /etc/version file.. set it back to 6.302.  Re-run the System Up2Date prefetch via Webadmin, then install.
    Thank you. I have followed your advice (except that I used joe to edit the /etc/version script), and I was then able to retrieve and install the updated version of the 6.303 patch. Hopefully, our office firewall will now be stable again.

    Prior to repatching it, we have had a total of nine firewall crashes these last few days. Each time the Astaro console would display the message Kernel panic - not syncing: Fatal exception in interrupt.
  • No problem.. we didn't see anyone with the crash issue on the customer units we updated, or our lab units.. but I did update the few that got the "older" 6.303 update in the same manner as I described for you.  By any chance did you start a ticket with Astaro?  I sure would be interested in what they had to say about your crashes.

    CTO, Convergent Information Security Solutions, LLC

    https://www.convergesecurity.com

    Advice given as posted on this forum does not construe a support relationship or other relationship with Convergent Information Security Solutions, LLC or its subsidiaries.  Use the advice given at your own risk.