This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

[Solved]After update 9.203-3 high CPU load

After the update I noticed that my UTM 220 HA-Cluster has 98% CPU load (shown in the dash), but only on the master node (the slave node behaves as ususal). When I switch roles by rebooting the master the other node goes up to 98% load, while the other one does not have the high load anymore. Output of TOP command: see attached screenshot. The deamon syslog-ng shows a constant 25% load which is not normal I guess.

Anybody else experiencing this problem? Is this maybe caused by a switch to a new syslog deamon which now goes through the old logs and generates metadata or something? The firewall UI and internet traffic appears to be as responsive as before, so no crazy uncontrolled CPU hogging is going on.


This thread was automatically locked due to age.
Parents
  • Tried it yesterday. No luck. After the sync I still got the same errors / sync did not work propperly. Pulled all the ethernet cables from the slave (node 2) and rebuilt it using the current config from the master (node 1). After the rebuild I switched all ethernet cables from node 1 over to node 2. So I have the former slave working as single UTM now with only minimal downtime from switching the cables. Currently there are no database related errors anymore. Next step will be to rebuild node 1 as well and connect it back so it forms a HA cluster again.

    Lots of work, as I don't do this stuff everyday. I hope the updates will be a bit more stable in the future.
Reply
  • Tried it yesterday. No luck. After the sync I still got the same errors / sync did not work propperly. Pulled all the ethernet cables from the slave (node 2) and rebuilt it using the current config from the master (node 1). After the rebuild I switched all ethernet cables from node 1 over to node 2. So I have the former slave working as single UTM now with only minimal downtime from switching the cables. Currently there are no database related errors anymore. Next step will be to rebuild node 1 as well and connect it back so it forms a HA cluster again.

    Lots of work, as I don't do this stuff everyday. I hope the updates will be a bit more stable in the future.
Children
No Data