This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Machine is little dead after 2 Days

Dear All,

i am using astaro 6.300 on Dual Pentium3 with 1 GB RAM and 40 GB Harddisk.
After 2 - 3 days the Firewall is not accesible anymore. If i am logon on the shell direct on the machine i can not ping anything. The networkcards seem to be down.

I do normally recieve emails if anything is down and restarted. But here - nothing.

After a reboot everything is fine. Only the load is on both CPU everytime on 50 to 70 % with confd-daemon.

Does anyone have an idea?


This thread was automatically locked due to age.
Parents
  • Please post output of "ps -aux"

    and please post the size of your real memory.
    Post "cat /proc/mtrr"

    Alex
  • Please post output of "ps -aux"

    and please post the size of your real memory.
    Post "cat /proc/mtrr"

    Alex


    what is the username? root/admin/??? --> somehow not really working.
  • ssh -l loginuser and then enter the shell password.
  • # ps -aux
    Warning: bad syntax, perhaps a bogus '-'? See http://procps.sf.net/faq.html
    USER       PID %CPU %MEM   VSZ  RSS TTY      STAT START   TIME COMMAND
    root         1  0.0  0.0   588  244 ?        S    08:11   0:05 init [3]
    root         2  0.0  0.0     0    0 ?        S    08:11   0:06 [migration/0]
    root         3  0.0  0.0     0    0 ?        SN   08:11   0:00 [ksoftirqd/0]
    root         4  0.0  0.0     0    0 ?        S    08:11   0:05 [migration/1]
    root         5  0.0  0.0     0    0 ?        SN   08:11   0:00 [ksoftirqd/1]
    root         6  0.0  0.0     0    0 ?        S
    root     22050  0.0  0.3  5532 3488 ?        Ss   14:59   0:00 /usr/bin/perl /usr/local/bin/sarg-logger.pl -f blocked
    root     22052  0.0  0.3  5668 3752 ?        Ss   14:59   0:00 /usr/bin/perl /usr/local/bin/sarg-logger.pl -f access
    root     22053  0.0  0.3  5300 3332 ?        Ss   14:59   0:00 /usr/bin/perl /usr/local/bin/reporter/vpn-reporter.pl
    root     22054  0.0  0.3  5264 3536 ?        Ss   14:59   0:00 /usr/bin/perl /usr/local/bin/reporter/sip-reporter.pl
    root     22055  0.0  0.6  8540 6568 ?        Ss   14:59   0:00 /usr/bin/perl /usr/local/bin/reporter/ips-reporter.pl
    root     22070  0.0  0.3  5800 3808 ?        Ss   14:59   0:00 /usr/bin/perl /usr/local/bin/reporter/cfilter-reporter.pl
    root     22071  0.0  0.3  5668 3756 ?        Ss   14:59   0:00 /usr/bin/perl /usr/local/bin/reporter/pfilter-reporter.pl
    root     22072  0.0  0.3  5776 3784 ?        Ss   14:59   0:00 /usr/bin/perl /usr/local/bin/reporter/smtp-reporter.pl
    root     22075  0.0  0.3  5372 3696 ?        Ss   14:59   0:01 /usr/bin/perl /usr/local/bin/reporter/admin-reporter.pl
    root     22076  0.0  0.6  8224 6448 ?        Ss   14:59   0:00 /usr/bin/perl /usr/local/bin/notifier.pl
    root      6499  0.0  0.0  1356  372 ?        S    15:25   0:00 /bin/logger -t httpd -p local6.notice
    wwwrun    6500  0.0  0.2  5716 3044 ?        S    15:25   0:00 /usr/sbin/fcgi- -f /etc/httpd/httpd.conf
    wwwrun    6501  0.0  0.2  5856 3052 ?        S    15:25   0:00 /usr/sbin/httpd -f /etc/httpd/httpd.conf
    root      7227  0.0  0.2  7288 2212 ?        Ss   15:26   0:00 sshd: loginuser [priv]
    root      8177  0.1  0.2  3972 2688 ?        SN   15:26   0:00 /usr/sbin/snmpd -c /etc/snmpd.conf -Ls daemon
    loginus   8386  0.0  0.2  7284 2196 ?        S    15:26   0:00 sshd: loginuser@pts/0
    loginus   8387  0.0  0.1  2900 1544 pts/0    Ss   15:26   0:00 -bash
    root      8587  0.0  0.1  2344 1080 pts/0    S    15:26   0:00 su -
    root      9047  0.0  0.1  2640 1536 pts/0    R    15:27   0:00 -bash
    root     10147  5.0  2.7 33648 28268 ?       S    15:27   0:00 /var/mdw/mdw_daemon.pl
    root     10159  0.0  0.0  2348  812 pts/0    R+   15:27   0:00 ps -aux
  • # cat /proc/mtrr
    reg00: base=0x00000000 (   0MB), size=1024MB: write-back, count=1
    reg01: base=0xfd000000 (4048MB), size=   4MB: write-combining, count=1
  • top - 15:30:46 up  7:19,  1 user,  load average: 1.86, 1.77, 1.74
    Tasks:  77 total,   4 running,  72 sleeping,   0 stopped,   1 zombie
     Cpu0 : 54.3% us, 16.4% sy,  0.0% ni, 28.1% id,  0.6% wa,  0.0% hi,  0.6% si
     Cpu1 : 58.3% us, 16.9% sy,  0.0% ni, 23.8% id,  0.5% wa,  0.0% hi,  0.5% si
    Mem:   1035716k total,   612260k used,   423456k free,    87684k buffers
    Swap:  1052248k total,        0k used,  1052248k free,   206960k cached

      PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
     2711 root      20   0 16020  12m 3592 R 39.3  1.3 226:22.33 confd
     2919 root      24   0 33640  27m 3868 S 31.0  2.7 120:02.55 mdw_daemon.pl
    15916 root      25   0 33644  27m 3888 R  4.4  2.7   0:00.09 mdw_daemon.pl
     2755 root      15   0 19672  14m 2884 S  1.5  1.4   5:27.21 v4watcher
     2589 root      15   0  6048 3144 2684 S  1.0  0.3   2:05.14 alicd
    15832 root      16   0  1948 1052  816 R  1.0  0.1   0:00.02 top
  • Isn't there out here somebody who can help?
  • I am really interested, why the machine is soooo busy.
  • Sorry for the delay.

    Maybe some tests will show more...

    Try reinstalling the ASL without SMP kernel.

    Please give it a try.

    Alex
  • di you think that 1 CPU is enough for 3 tunnels a 2 Mbit/s

    I will try reinstalling this weekend.
  • Yes, 1 PentiumIII CPU should be plenty for 2Mbps VPN.
  • Yes this will work ...

    I do this with 4 Tunnels .My Cpu is an P3 933Mhz with 512MB Ram, while the cpu isn´t busy at all.

    Try it out.

    Alex
Reply Children
  • if 1 GHz is enough, why is this mache sooo busy?
  • Can you attach the device to a monitor? Would be interresting if the device goes into a kernel panic or just freezes.
  • Hi everybody,

    i installed it as new.
    First try was to install it as nosmp.
    This was not working, etiher i was changeing the mps in bios for multiple prozessors from v.1.4 to 1.1 (There was a bug in early days of suse and asus bios).
    Astaro is working on Suse Enterprise 9 so i looked araound in my notices and there it is, i have to disable apm and apic.

    Therfore i was choosing the classic at bootpromt. seems to be better - BUT only one cpu is detected.

    To: nimmdirkeks: the machine is not really dead, only a little bit. the networkcards are all not working, but the system don't recognise this!
    There is not output at the connected screeen
  • i installed it from scratch.
    Installation from 6.100.
    confd seems to be working in a normal way.
    --> update with patches to 6.301 --> confd is now taking all the cpu power.

    dont't look like a problem with smp-kernel. looks like a problem from astaro!
    They patched my machine to dead.
  • You did all patches starting from 6.100 ??

    There is an ISO image of V6.3 ....

    I don ´t know anyone other who has same problems as you have.
    I started with V6.0 and patched all the time till now.

    Maybe your hardware is faulty ..

    Check it or try installing V6.3 from scratch.

    Alex
  • I agree, doesn't look like a hardware problem. At what patch level does the high CPU utilization occur? Have you opened a trouble ticket with Astaro?

    Starting with the 6.3 ISO is a good idea as well.
  • Hi everybody,

    i installed new iso 6.300 on another machine with the same hardware.
    (comes from old cluster).

    The machine is as busy as it is before --> something around 60 to 80 Percent.



    How can i open a trouble ticket? We paid 4000 Euro for software which is not really running and than we also have to pay for support? This is a little bit unbelievable.

    Best regards
  • Contact your reseller , he should be able to open a ticket.

    What about your hardware? Is it really all supported.

    Please post any news here. It´s interesting what Astaro will tell you and what the problem is at the end.

    Alex
  • No output on the screen? No login line, no boot informations?

    Is it a Proliant server?
  • Hi all,

    i see the login line and i can login. 
    If i am looking at the screen when the machine is "little dead" --> not reachable from network (internal and external).
    To have a loot at /var/log/messages .... --> no error came up.

    But now i was reinstalling the stuff on another hardware. Perhabs it was a hardwareproblem. We will see this within the next2 to 5 days.

    The other problem - the machine is busy  - the service confd is using the hole time 50 to 70 Percent cpu-power: look at the answer from the good guys - (ironic)!
    I paid 4000 Euro and get nothing, but a buggy software without support. Really nice.

    This is what i will point out into my signature next time. Everyone should have this in mind before buying astaro.
    Sehr geehrter Herr Krischeu,

    bitte haben Sie Verständnis, dass der Astaro Support ein reiner Partnersupport sowie 2nd Level Support ist. Bitte kontaktieren Sie immer zunächst Ihren zuständigen Partner bzw. die Distribution, die Ihnen bei Fragen der Konfiguration sicherlich gerne und kompetent weiterhelfen. Ihr Partner kann Ihre Fragen und Problemstellungen zu den Bedingungen Ihrer Gold- und Silver-Maintenance an den Astaro Support weiterleiten und einen direkten Kontakt herstellen.

    Bitte entnehmen Sie eine genaue Beschreibung der Support Bedingungen aus dem dem 'ASTARO CUSTOMER SUPPORT SERVICES REFERENCE GUIDE' unter https://my.astaro.com/partner/support.

    Weiterhin finden Sie kostenlose Hilfestellungen in unserer Knowlege Base unter http://www.astaro.com/kb, in der zu sehr vielen Themen bereits Anleitungen und Howto´s verfasst wurden.

    Ich möchte Sie außerdem auf unser User Bulletin Board http://www.astaro.org hinweisen.

    Mit freundlichen Grüssen

    Astaro Support Team EMEA  


    -----Original Message-----
    From: heinz.krischeu@easi.de
    Sent: 7/26/2006
    To: Astaro Support - web form
    Subject: ASG is busy


    Dear Hotline,
    i am very active at the bulletin board (krischeu).

    In most cases it was helpful. But now i came to a point, where no one can give me a help.

    After installing and replaying the backupfile the firewall is busy all the time from 60 to 80 percent. the service "confd" is using all the time the cpu-power.

    i installed it as smp and classic same problem. installation as nosmp failed without error message.
    I installed it on the same hardware again, but on another machine - same problem.

    Hardware is: Dual P3, Fujitsu-Siemens Serverworks Mainbord, 1 GB RAM, 40 GB IDE HDD