Guest User!

You are not Sophos Staff.

This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

High CPU usage in cluster node

Hello, I have  2 ASG 320 in HA cluster configuration  and sometimes happen a strange problem:
The primary node  use high CPU ( 100% ) for 8-10 min; all performance degrade so VPN , incoming connections, and occasionally webadmin authentications fails.
I have identified some HA Sync daemon restart in those case
"HA confd sync daemon not running - restarted" and also "HA ctsync daemon not running - restarted".

Both ASG were restarted but problem persist; any idea ?

ASG version 7.507, pattern 20497
high cpu load was xpecially identifyed on the slave node, I suspect problem syncronization when changing role from master to slave

2010:10:20-10:56:27 firemin-2 kernel: nf_log_packet: can't log since no backend logging module loaded in! Please either load one, or disable logging explicitly
2010:10:20-10:56:28 firemin-2 kernel: asg_cluster: set master_id to 1
2010:10:20-10:56:49 firemin-2 kernel: nf_log_packet: can't log since no backend logging module loaded in! Please either load one, or disable logging explicitly

In my opinion when a high in/out going connection was detected and cpu load >80% cluster fail to check heartbeats and try to switch node but fail during datafile syncronizations.

look attached log :


This thread was automatically locked due to age.
Parents
  • I was guessing that the culprit was PostgreSQL.  The "unexpected EOF on client connection" is "normal" - it's an example of messages used by the developers to debug their code, but has no meaning for admins.  I don't think the "duplicate key value" message is that unusual either.  The one thing you might try is reducing the number of months you keep reporting data (Reporting >> Settings).  

    Cheers - Bob
Reply
  • I was guessing that the culprit was PostgreSQL.  The "unexpected EOF on client connection" is "normal" - it's an example of messages used by the developers to debug their code, but has no meaning for admins.  I don't think the "duplicate key value" message is that unusual either.  The one thing you might try is reducing the number of months you keep reporting data (Reporting >> Settings).  

    Cheers - Bob
Children
  • today my configuration have a lot of problems...
    The slave ASG320  is sending a lot of alert like this:

    HA confd sync daemon not running - restarted
    -- 
    HA Status          : HA SLAVE (node id: 2)
    System Uptime      : 43 days 16 hours 26 minutes
    System Load        : 0.22
    System Version     : Astaro Security Gateway Appliance 7.507

    Once every hour  !