This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

V7.006 freezing once a week :-(

Hello Folks,

one of the V7 machines that I administer crashes around every 4-7 days and I just can't find the cause.
The log files I looked at didn't show any unusual error messages. When the system freezes I can't even log in to the local console, the screen stays blank.
I would guess on a hardware issue but then the installation discovers and sets up all devices correctly. Plus I have some identical boxes running quite fine.

The configuration is:

Jetway J7F2WE1G2E P 1200MHz Mini-ITX
VIA Esther processor 1200MHz
Jetway Adapter 3x10/100 Lan
1,0 GB DDRII-RAM 533MHz lowpro.0,8"
Seagate ST380811AS
PHILIPS CD-RW/DVD-ROM SCB5265

Has anyone else had difficulties with similar hardware so far?

Will Astaro support help or do they just lean on the fact that their useless HCL does not list any VIA hardware at all?

I would be really happy if anyone could give me any advise..

Big Thanx in advance!

DiePlage


This thread was automatically locked due to age.
Parents
  • You could be hitting one of the bugs that causes v7 to lock up as well (do a search).

    If memtest86 doesn't show any errors after running for 12+ hours, the memory is likely OK. If you have spare hardware with the right number of NICs, you can easily swap out the hardware as well while you're testing the existing hardware.
  • Bugs? There are bugs? [:)]
  • I know....  Where does drees get these whacky ideas from...  [:)]
  • ok, to be honest this is the buggiest astaro-version I have ever dealt with...

    Looks like I found the source of our stability-problems.
    Let me mention, that the first level-support (which is not done by astaro but by their distributor's technicians) was actually quite helpful. Regardless of HCL...

    It looks like the current kernel has known compatibility problems with via-chip sets (even those used in astaro's own 120/220 units). A new kernel will be released by the end of the week. Right now there seem to be memory-allocation bugs causing memory leaks.
    I suppose this is what I was experiencing because a Linux system completely out of memory would show exactly those symptoms.
    Just to be sure, I have a spare appliance at hand if the new kernel doesn't solve the problem an I am back down to a hardware problem...
Reply
  • ok, to be honest this is the buggiest astaro-version I have ever dealt with...

    Looks like I found the source of our stability-problems.
    Let me mention, that the first level-support (which is not done by astaro but by their distributor's technicians) was actually quite helpful. Regardless of HCL...

    It looks like the current kernel has known compatibility problems with via-chip sets (even those used in astaro's own 120/220 units). A new kernel will be released by the end of the week. Right now there seem to be memory-allocation bugs causing memory leaks.
    I suppose this is what I was experiencing because a Linux system completely out of memory would show exactly those symptoms.
    Just to be sure, I have a spare appliance at hand if the new kernel doesn't solve the problem an I am back down to a hardware problem...
Children

  • It looks like the current kernel has known compatibility problems with via-chip sets (even those used in astaro's own 120/220 units). A new kernel will be released by the end of the week. Right now there seem to be memory-allocation bugs causing memory leaks.


    That might very well be the case. I have two brand new ASG120 units both locking up weekly (7.006 as well as 7.007 firmware). And I heard multiple customers are experiencing this problem.

    I am planning on opening a gold support case on this on monday.
  • Interesting, my ASG120 box consists of the following hardware:
    asg1:/root # cat /proc/cpuinfo
    processor       : 0
    vendor_id       : CentaurHauls
    cpu family      : 6
    model           : 10
    model name      : VIA Esther processor  800MHz


    asg1:/root # lspci
    00:00.0 Host bridge: VIA Technologies, Inc. P4M800CE Host Bridge
    00:00.1 Host bridge: VIA Technologies, Inc. P4M800CE Host Bridge
    00:00.2 Host bridge: VIA Technologies, Inc. P4M800CE Host Bridge
    00:00.3 Host bridge: VIA Technologies, Inc. PT890 Host Bridge
    00:00.4 Host bridge: VIA Technologies, Inc. P4M800CE Host Bridge
    00:00.7 Host bridge: VIA Technologies, Inc. P4M800CE Host Bridge
    00:01.0 PCI bridge: VIA Technologies, Inc. VT8237 PCI Bridge


    Looks like the firmware doesn't work well with the VIA hardware.
  • Now check this out:
    http://forums.debian.net/viewtopic.php?t=16223&sid=93c5cb315c871cce5854dc13dff809f0

    Quote: "I don't know specifically about the esther, but the via c3 and c7's are 586 cpus. Actually, I don't think that that is strictly true, but I know that they [VIA Esther processors] run best as 586 and can have problems with 686."

    When I run 'uname -a' on my ASG120:
    Linux asg1.lan.******x.com 2.6.16.43-54-default #1 Tue Jul 24 17:11:28 UTC 2007 i686 i686 i386 GNU/Linux

    Perhaps Astaro can provide a i586 kernel to test with..

    More problem references/solutions:
    http://forums.viaarena.com/messageview.aspx?catid=28&threadid=77032
    http://lkml.org/lkml/2007/5/22/37
  • Hi AVGDon, 

    that is not the issue, a 686 kernel would not even boot an an 586 CPU as it does not offer all needed 686 kernel functions.

    as you can see in your cpuinfo dump
    cpu family : 6

    asg uses the newer via processors which are 686 compatible.

    Also the ASG220 does not use a VIA chipset or CPU but strictly intel components.

    It has in fact something todo with the amount of memory, 512MB is currently 
    this not enough if you enable many features.

    we plan to lower the overall memorz usage by about 20-30% during the next 2 or 3 up2date packages. 
    This will make things a lot smoother.

    best regards
    Gert
  • Hi AVGDon, 

    that is not the issue, a 686 kernel would not even boot an an 586 CPU as it does not offer all needed 686 kernel functions.

    as you can see in your cpuinfo dump
    cpu family : 6

    asg uses the newer via processors which are 686 compatible.

    Also the ASG220 does not use a VIA chipset or CPU but strictly intel components.

    It has in fact something todo with the amount of memory, 512MB is currently 
    this not enough if you enable many features.

    we plan to lower the overall memorz usage by about 20-30% during the next 2 or 3 up2date packages. 
    This will make things a lot smoother.

    best regards
    Gert

    is one of those things redoing your squid config gert?  That's the biggest thing that pushed so many astaro machines into swap.  The second biggest is leaving vm.swappiness at the default(which for most distros is 60).

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • Hi there, 

    we plan to remove squid completly in the october up2date package.
    The squid functionality we needed has now been integrated into our own proxy, which has also changed in many areas delivering an improved performance with less resource usage.

    regards
    Gert
  • interesting..i'll be very interested in this.  The issue with the squid config is it's predilection to cache in ram(which is easily changed).  How about the default swap happy kernel?  Any plans to change that to zero or something around there?

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow


  • It has in fact something todo with the amount of memory, 512MB is currently 
    this not enough if you enable many features.


    Hello Gert,

    Even if 512MB isn't enough, the appliance shouldn't just lock up. Now, when it locks up once a week, the device doesn't even respond to pings. If the 512MB isn't enough, the appliance but just get very slow instead of locking up.

    This means there is a critical kernel/hardware issue, or the hardware is just plain faulty.
    Also, there are a lot of issues with the VIA Esther processor, so it it very likely the ASG120 is hit by one of these issues.

    Also as noted, the VIA Esther is basically a i686 processor but might still be having issues when the kernel is compiled as such.

    I sincerely do not believe your suggestion is going to lead to a solution for this problem and will only lead to a performance improvement.

    Kind regards, Don
  • Hi guys,

    Just got a new ASG120 with the Via Esther 800Mhz processor. It is locking up just like what AVGDon says. Our other ASG120s don't (Same ASL Version V.7.006) It appears only to happen when the unit synchs with the NTP server configured. Interesting to find that the unit is 1 hour ahead, yet still has my time zone set to Europe/London.

    Does that help Gert?
  • Is it possible to upgrade the RAM to 1024? That migth be helpful to prevent these lockups. My 4 devices stil crash, even in HA setup with 7.009 they die. And worst of all, even a reboot didn't help, so I had to re-initialize both!