This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Strange behavior of couple of ASG320 in HA setup

Hello all,
The organisation I work for uses a couple of ASG320 in high availability setup as a main gateway. For the last few weeks / months, this setup has been intermittently acting up, causing us some trouble.

Symptoms :

every X days (from 1 to 6/7 days), at a seemingly random time, the CPU usage of the appliance will shoot up to 100% for several hours, making everything slow down to a crawl. Loss of internet connectivity, websites in the DMZ not accessible to the outside world, extremely sluggish access to the admin interface of the appliance. 

We don't use web or email proxy, so I guess the issue is not caused by those. Also, switching to the other appliance in the HA setup solves the problem temporarily - so I guess the issue is not caused by some kind of attack overloading the appliance.
We've tried reviewing the logs, but were unable to find anything significant.

Has anybody experience such an issue before? Any help/pointers would be much appreciated.

Thanks!


This thread was automatically locked due to age.
  • [LIST=1]
    • Does it may started after an update?
    • Which version is currently installed on the nodes?
    • After switching the master, has the new slave still a high load or not?
    • [/LIST]
  • Hello, thanks for your answer!

    Does it may started after an update?


    I think so, but I'm not sure exactly which one - all I can say is that we applied several updates since, hoping that said updates would maybe clear the problem.

    Which version is currently installed on the nodes?

    7.502

    After switching the master, has the new slave still a high load or not?


    I'm not sure. I'll check that next time the issue happens.

    I'll get back to you with more precise information if possible as soon as possible.
  • To prepare for the next time, you can enable SSH access to the box.

    Then, when it happens, you hopefully are able to ssh into the box. If so, you can run "top" to see which process makes the high load. Or maybe it swaps stuff out which makes it very slow.