This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Super high CPU % (Plus funny story)

So, I've been playing with the ASG for some time now in my lab at home, and I really wanted to show it to some one. I jump online, VPN'd in and showed them how easy it is. After work we headed over to the house to see it first hand and when we arrive I find the gateway just killing itself at 100% CPU usage. Nothing was possible, IE web browsing, or even logging in to the system... (yes I did get in at one point see pictures)

Image asg100.jpg shows the system running at 100% CPU even though it has worked flawless for 25+ days. CPU never really peeked over 40% for any reason during that time.

Image asgday.jpg shows a snapshot of the physical servers CPU usage for the day.

Image asgtop.jpg shows a snapshot of a ssh session running the "top" command.

Image asg100-r.jpg is a picture of how the CPU% continued to peek after rebooting many times, even after adding a second CPU (1 ghz p3x2) and adding 3 times the amount of ram. It didn't slow down for hours. 

No users at all using the system for anything. But still the httpproxy is using up all the proc. As a test I unplugged the larger 48 port switch and plugged in a four port which removed all computers in my lab network and allowed me to connect a single computer. 

Needless to say the person I was trying to show and suggest Astaro to was completely unimpressed.

What I can't understand for the life of me is I've been using the ASG flawlessly for a month. Thing has been like a damn top. So what happened today?


This thread was automatically locked due to age.
Parents
  • By the way, just because I wanted to see what it would do, I did let it run its course. Keep in mind that the ASG box did not have access to the internet and no computers were using the ASG box.

    After five hours of waiting the box finally slowed and was running at around 10% CPU which is what I know to be normal for my ASG. See screen shot.

    Anyone have any ideas?
  • Jayson, I have no idea why that happened to you either; we've not seen that behavior out of the httpproxy process ever on any of our rather numerous client Astaro devices.  Are there any interesting entries in the httpproxy logfiles or other logfiles?
  • I had an issue with 100% cpu and it turns out that a dns forwarder was not responding. . . .


    Good to know.  Thanks!
  • Hi all
    We using ASG V7.104. We have same problem. CPU% goes up 100% and then down till ~10% every 15min. No signs in Log files. But after few weeks CPU% grows up and don't went down and stays at 80-100%.
    Via ssh we saw - mysql process use lots of CPU.
    For our business unit ASG is very critical, we have platinum support, but nothing helped (we couldn't allow access for support, regarding security reasons).
    Our proxy started work terrible. We couldn't restart ASG every time so we started monitoring how much mysql process use CPU (via SNMP) and when it becomes very high, we just log in via SSH  end restart mysql with -  /etc/init.d/mysql restart
    CPU wents down, node works properly without stopping, no impact to service.
    Try it!
  • running 7.200 i have the same kind of 100% cpu what results in that the box just stops working.

    the box can be running without any load other then a couple KB of traffic when this happened.

    i have managed to ssh and run top to see that two daemons, snort_inline & barnyard, were eating more then 98% cpu creating a total of 100% cpu and bring the box to a still stand.

    i have created an cron to restart the sql daemon every midnight just to be sure.

    i have reinstalled the box with a new 7.200 image to be sure of no beta firmwares. i did a 12 hours memory test what was all fine. did a hard drive test all fine with no errors.

    at the moment i have disabled:
    Intrusion Protection
    FTP Proxy
    IM/P2P

    but with no results.
  • after clearing Proxycache, the cpu is going down to 10%
  • thanks,

    but what has the daemons snort_inline & barnyard to do with the proxycache? i don't understand that if it has.

    i would expect that the daemon proxycache is taking all the cpu when checking with top. but it's not when this 100% cpu happens. it's always snort_inline & barnyard hammering the processor. 

    i might go back to 7.104 since this is not a workable situation.
  • i still investigate this issue.

    i found out that when i have the "Synchronize time with internet server" on "NTP Server Pool" (default) no issues but the firewall isn't running on the local time even with the correct tme zone (london) set.

    so i changed the "Synchronize time with internet server" to an uk ntp pool. after this the box goes on 100% cpu for about 1 min and start doing those drops / 100% cpu's once a while. changing it back to "NTP Server Pool" all is well (no drops over a couple days).

    now the BIG question is why!!!

    if it has something to do with this ntp time setting than i should expect the ntpd daemon eating all the cpu cycles and not both snort_inline & barnyard!

    i now have pointed the "Synchronize time with internet server" to my own web box what is an ntp box too since yesterday and will report what ever happened.

    hope this will help others.

    gert / astaro can you test this? since i can reproduce this every time.
  • Hi,
    the NTP server you use as a source will not affect your local time much. Changing the NTP server to a local will increase the accuracy of of your ASG as a reference, but as I doubt you are doing hugely accurate time relationship applications with other people on the planet I don't think you need to worry about the accuracy or jitter.

    There is more a likelyhood that the ASG is doing its own thing because this version (v7.2x) of the ASG can't use dynamic NTP pools.

    Ian M
  • So Astaro's set to use the default NTP Pool are instead not syncing with any NTP servers at all?

    Is this a permanent intentional change or is this a known issue that's scheduled to be remedied in the next update or two?

    Therefore in service Astaro's that are trying to use the pool are instead using their internal clock - or are they just randomly going their merry way?
  • Hi,
    I don't honestly know the answer to your question. The NTP pool issues was pointed out during the beta testing, you actually need to point at one NTP server and the ASG NTP function then works correctly. I currently have my ASG pointing at the Oceania pool, but the ASG only recognises one address, it can't handle the round robin of a pool, it always has the same address. I think the issue is the current version is setup to not to use the DNS refresh for NTP. 

    Ian M
  • well i can only report that since i have my box pointing to my web box (what also does ntp) all is fine... and this box i use is a complete reinstall with the latest 7.200 iso. i indeed used this box for the beta tests but reinstalled it since i also have an pentium iii box as backup.
Reply
  • well i can only report that since i have my box pointing to my web box (what also does ntp) all is fine... and this box i use is a complete reinstall with the latest 7.200 iso. i indeed used this box for the beta tests but reinstalled it since i also have an pentium iii box as backup.
Children
  • well i can only report that since i have my box pointing to my web box (what also does ntp) all is fine... and this box i use is a complete reinstall with the latest 7.200 iso. i indeed used this box for the beta tests but reinstalled it since i also have an pentium iii box as backup.


    I point mine at a GPS based NTP device and it works great.