This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

ASG v7 always crashes within a day?

Hi guys,

I am quite frustrated with my new ASG v7.005 setup at the moment. I installed it on my new Asus Pundit P1 Barebone (the specifications are in my signature) and there is always a certain point of the day where the ASG hangs so that you cannot login via ssh or webadmin. It is totally dead and needs a hard reboot.

I cannot access web pages as well, the internet is dead to me. I have http proxy running and IPS but I think my system has enough resources to manage. No I shut down the http proxy and will see if the ASG will still run tomorrow. Does anybody have the same problem? Here is a snippet of my kernel.log from the time the ASG crashes:

2007:07:09-07:49:18 (none) kernel: CSLIP: code copyright 1989 Regents of the University of California

2007:07:09-07:49:18 (none) kernel: PPP generic driver version 2.4.2
2007:07:09-07:49:19 (none) kernel: tun: Universal TUN/TAP device driver, 1.6
2007:07:09-07:49:19 (none) kernel: tun: (C) 1999-2004 Max Krasnyansky 
2007:07:09-07:49:20 (none) kernel: MPPE/MPPC encryption/compression module registered
2007:07:09-07:49:20 (none) kernel: PPP BSD Compression module registered
2007:07:09-07:49:20 (none) kernel: PPP Deflate Compression module registered
2007:07:09-07:49:25 (none) kernel: Ebtables v2.0 registered
2007:07:09-07:49:25 (none) kernel: netfilter PSD loaded - (c) astaro AG
2007:07:09-07:49:35 (none) kernel: parport0: PC-style at 0x378 [PCSPP(,...)]
2007:07:09-07:49:35 (none) kernel: parport0: PC-style at 0x378 [PCSPP(,...)]
2007:07:09-07:49:35 (none) kernel: Device not ready. Make sure there is a disc in the drive.
2007:07:09-07:49:35 (none) kernel: Device not ready. Make sure there is a disc in the drive.
2007:07:09-07:49:39 (none) kernel: device eth0 left promiscuous mode
2007:07:09-07:49:39 (none) kernel: eth0: Promiscuous mode enabled.
2007:07:09-07:49:39 (none) kernel: device eth0 entered promiscuous mode
2007:07:09-12:07:35 (none) kernel: Bad pte = 0000a666, process = confd.plx, vm_flags = 100077, vaddr = 8803f28
2007:07:09-12:07:35 (none) kernel: [] __handle_mm_fault+0x942/0x9c0
2007:07:09-12:07:35 (none) kernel: [] work_resched+0x5/0x16
2007:07:09-12:07:35 (none) kernel: [] notifier_call_chain+0x34/0x40
2007:07:09-12:07:35 (none) kernel: [] do_page_fault+0x3b2/0x640
2007:07:09-12:07:35 (none) kernel: [] do_page_fault+0x0/0x640
2007:07:09-12:07:35 (none) kernel: [] error_code+0x4f/0x54
2007:07:09-12:07:35 (none) kernel: VM: killing process confd.plx
2007:07:09-17:54:26 (none) kernel: Netfilter messages via NETLINK v0.30.


You can see that the ASG went down at around 12:07 this morning. At 17:54 I rebootet the device. Can you see anything in this log that logs suspicious? Do you need other logfile excerpts?

Thanks in advance for your help!


This thread was automatically locked due to age.
Parents
  • Forgot to mention that also the up2date service isn't running correctly. Sometimes it works and sometimes not. Here is my version:

    Current pattern version: 3562
    Latest available pattern version: 3571

    This is the pattern I have for over a day now! And I do not have that much traffic here at home, just two Macintosh computers...
  • Radiohead, the kernel stack trace you see at 12:07 is definitely an issue, but doesn't appear to be related to the http proxy at all.

    Given that this is new hardware, I have to wonder if it is flaky and possibly is suffering from bad RAM? Did you test the hardware using memtest or similar tools before installation?

    If it's not bad RAM, it appears to be a bug in the kernel that ships with 7.005.
  • No I did not test this. I will do this right now. Hope there will be no errors...
  • Looks like bad hardware (ram, processor, board, etc.)... I haven't had any Version 7 units crash in this manner so far.

    Remember, NEW stands for Never Ever Worked ... :-)

    CTO, Convergent Information Security Solutions, LLC

    https://www.convergesecurity.com

    Advice given as posted on this forum does not construe a support relationship or other relationship with Convergent Information Security Solutions, LLC or its subsidiaries.  Use the advice given at your own risk.

  • [;)]

    I am running the memtest right now. The first pass is over and had no errors. I think I'll leave it on in the night. Isn't the asus pundit hardware supported? I think it has an nforce chipset of some kind. Is the 7.005 version that buggy?
  • Okay. Two passes without error in memory. Anyone any hint on the up2date issue?

    Current pattern version: 3562
    Latest available pattern version: 3572

    Now the version step is even bigger...
  • Hmm, usually any significant memory errors would turn up after a couple hours, but running overnight is a good idea.

    How much memory do you have in the machine?

    If you do have support, I would open a trouble ticket, but some quick google searches haven't turned up anything related to those errors.
  • [;)]

    I am running the memtest right now. The first pass is over and had no errors. I think I'll leave it on in the night. Isn't the asus pundit hardware supported? I think it has an nforce chipset of some kind. Is the 7.005 version that buggy?

    nforce chipsets are not server class..and plus the drivers for the nforce had to be severely reverse engineered.  I would use anything by Intel or via in terms of chipsets but not nvidia.

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • This is for my home network only so I guess the nforce should'nt be the problem. Besides I am running just two Macs behind the Astaro, which she should manage to handle.

    Oh boy, if that doesn't work I'll stick with my WG Firebox [;)]
  • This is for my home network only so I guess the nforce should'nt be the problem. Besides I am running just two Macs behind the Astaro, which she should manage to handle.

    Oh boy, if that doesn't work I'll stick with my WG Firebox [;)]

    it could be a problem if the drivers for the nforce aren't acting correctly which could be the issue.  Try passing noapic to the kernel at boot and see if that stabilizes things a bit.

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • It seems that after I deactivated IPS and the HTTP Proxy the ASG is running fine. It is up for 21 hours now, so it seems that the 7.005 is some kind of buggy.

    How would I pass the noapic to the kernel to make it permanent? Is there a grub.conf on the ASG?
  • Unless I missed it, you never said how much memory you have in the machine...
Reply Children
  • he has a gig in the box

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • he has a gig in the box

    Ah, I hide signatures so it must be in there. Anyway, with a gig of memory that shouldn't be an issue.
  • Hi guys,

    well it seems that the 7.005 is the problem. Now the ASG runs fine for about 1D and 8H with no problems at all. The only thing that does not work is the update of the patterns. It is still behind the current version. Currently it is:

    Current pattern version: 3592
    Latest available pattern version:     3603

    But as you can see, the update works but it still needs a lot of time and is never up2date to the most current version. Waiting for 7.006 to use the proxy and IPS again...
  • the patterns will be installed depending on your license.  This is normal operation.

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • Okay. Since I own a home license I do not get the updates in time?
  • no just that not every pattern is going to be available to your machine due to licensing.  The home license patterns are installed automatically as soon as they are available and downloaded by your asg.

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • Thanks William! Now I understand. There are different pattern versions for the different licenses. I was just curious since the latest available pattern is always shown in my webadmin, but I always have a 'lower' version number installed. Thanks.
  • well it seems that the 7.005 is the problem. Now the ASG runs fine for about 1D and 8H with no problems at all.

    You mean disabling the http proxy and IPS fixes the problem?
  • You mean disabling the http proxy and IPS is the problem?


    No. When I disable both, the ASG runs fine. Today I started enabling one service again (IPS) and after approx 2,5h the ASG hung again with confd.plx using 100% CPU. After disabling it (which now worked, I could login to webadmin) and waiting 5 minutes, everything went back to normal...
  • No. When I disable both, the ASG runs fine.
    That's what I meant, clarified my original post.
    Today I started enabling one service again (IPS) and after approx 2,5h the ASG hung again with confd.plx using 100% CPU. After disabling it (which now worked, I could login to webadmin) and waiting 5 minutes, everything went back to normal...

    OK, so you've narrowed it down to IPS now so it's not the http proxy. Would be nice to try to figure out what network behavior if any is triggering the hang/sluggishness.

    We already know that BitTorrent will do a number on the IPS software.