Guest User!

You are not Sophos Staff.

This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Can someone tell me what "Current load average" is?

We have a 2 node HA cluster, each box is a dual hexa-core 8GB RAM system. Dashboard graphs show CPU at 17%, RAM at 27%, but in the HA live log I see these warnings:
2011:10:27-00:03:16 secgate-an-2 ha_daemon[6011]: id="38A1" severity="warn" sys="System" sub="ha" name="Current load average 12.58 is high!"

2011:10:27-00:03:17 secgate-an-1 ha_daemon[5977]: id="38A1" severity="warn" sys="System" sub="ha" name="Current load average 12.58 of node 2 is high, please check you system!"
2011:10:27-00:06:28 secgate-an-1 ha_daemon[5977]: id="38A1" severity="warn" sys="System" sub="ha" name="Current load average 11.16 is high!"
2011:10:27-00:06:29 secgate-an-2 ha_daemon[6011]: id="38A1" severity="warn" sys="System" sub="ha" name="Current load average 11.16 of node 1 is high, please check you system!"
2011:10:27-06:51:08 secgate-an-1 ha_daemon[5977]: id="38A1" severity="warn" sys="System" sub="ha" name="Current load average 15.65 is high!"
2011:10:27-06:51:10 secgate-an-2 ha_daemon[6011]: id="38A1" severity="warn" sys="System" sub="ha" name="Current load average 15.65 of node 1 is high, please check you system!"
2011:10:27-06:52:09 secgate-an-1 ha_daemon[5977]: id="38A1" severity="warn" sys="System" sub="ha" name="Current load average 10.80 is high!"


This thread was automatically locked due to age.
  • Maybe the best to explain that with an example:

    If you have 10 Processes with full CPU load, you will have a load of 10 (OK, a bit below).
    If you have 10 cores and 10 Processes with full CPU load, it's "OK". All 10 cores will have its CPU at ~100%

    But, however, 10 to 15 sounds a bit high for me, except you have a very very high throughput. You may should check the "Process List" to find out what it causing this high load.
  • Thanks for the reply, What I don't understand, is if the CPU is taxed, then why does it say it is only 17% utilized?

    Maybe the best to explain that with an example:

    If you have 10 Processes with full CPU load, you will have a load of 10 (OK, a bit below).
    If you have 10 cores and 10 Processes with full CPU load, it's "OK". All 10 cores will have its CPU at ~100%

    But, however, 10 to 15 sounds a bit high for me, except you have a very very high throughput. You may should check the "Process List" to find out what it causing this high load.
  • For example, I am logging warning right now for 19.06 and this is the top stats


    top - 09:49:30 up 21:54,  2 users,  load average: 8.18, 8.83, 5.54
    
    Tasks: 274 total,   5 running, 268 sleeping,   0 stopped,   1 zombie
    Cpu0  : 35.3%us,  3.6%sy,  0.3%ni, 47.6%id,  2.3%wa,  0.0%hi, 11.0%si,  0.0%st
    Cpu1  : 55.1%us,  2.3%sy,  0.3%ni, 33.8%id,  4.9%wa,  0.0%hi,  3.6%si,  0.0%st
    Cpu2  : 21.6%us,  6.9%sy,  0.0%ni, 69.6%id,  2.0%wa,  0.0%hi,  0.0%si,  0.0%st
    Cpu3  : 54.2%us,  6.4%sy,  0.0%ni, 39.4%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
    Cpu4  : 11.0%us,  7.8%sy,  0.0%ni, 79.5%id,  1.6%wa,  0.0%hi,  0.0%si,  0.0%st
    Cpu5  : 41.3%us,  7.9%sy,  0.0%ni, 44.9%id,  5.9%wa,  0.0%hi,  0.0%si,  0.0%st
    Cpu6  :  8.2%us,  6.2%sy,  0.0%ni, 85.2%id,  0.3%wa,  0.0%hi,  0.0%si,  0.0%st
    Cpu7  :  7.6%us,  2.3%sy,  0.0%ni, 88.8%id,  1.0%wa,  0.0%hi,  0.3%si,  0.0%st
    Cpu8  : 82.9%us,  3.3%sy,  0.0%ni, 13.8%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
    Cpu9  :  1.6%us,  1.3%sy,  0.0%ni, 97.1%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
    Cpu10 :  3.9%us,  4.6%sy,  0.0%ni, 91.4%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
    Cpu11 :  2.6%us,  1.0%sy,  0.0%ni, 96.4%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
    Mem:   8174924k total,  8115444k used,    59480k free,   218572k buffers
    Swap:  1052248k total,    17668k used,  1034580k free,  6226952k cached
  • Good question.

    If there are, for example, 10 processes running, but only on two cores, than you have a load of 10, but the average of all 12 cores (in you case) is only ~17% because only two of the 12 available CPU's are used.

    You can connect to your ASG over SSH and execute "top". If you press "1" you will see all the singel cores of the CPU's.
  • And what processes are causing this high load?

    What is your "normal" network throughput?
  • And what processes are causing this high load?

    What is your "normal" network throughput?


    It looks like httpproxy and postgres.  We are a large community college and push 10's of thousands of connections through during the fall/spring terms.

    Here is current connections graph


    and here is the traffic report:


    I notice when viewing top stats that I always only see one instance of the httpproxy process but see 2 or 3 postgres processes, can't the httpproxy utilize sms to have multiple instances of the httpproxy? This is with Irix mode turned off.
  • I had a look into the sizing guide. And for the ASG 625, which has less CPU power than your setup, they expect 850 MBit/s for HTTP Proxy in average. Could be lower if you also do intensive IPS for example.

    Hard to say if your load is OK or to high. Sounds to high for me personally. Specially if you have an active/active cluster.

    You may should ask your reseller or Astaro directly (if you have premium support) to have a closer look at it.
  • Thanks for the reply.  Yeah we have "premium" and have been waiting for a response to our ticket.  We also asked them if it was better to have hyper-threading turned on or off and they have not answered that either.  We noticed a sharp drop in the quality of support after Sophos bought them.  Anyway, I will update the thread if we get a definitive answer from Astaro. 

    I had a look into the sizing guide. And for the ASG 625, which has less CPU power than your setup, they expect 850 MBit/s for HTTP Proxy in average. Could be lower if you also do intensive IPS for example.

    Hard to say if your load is OK or to high. Sounds to high for me personally. Specially if you have an active/active cluster.

    You may should ask your reseller or Astaro directly (if you have premium support) to have a closer look at it.