This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

7.402 filling up the logs

Yesterday my firewall (7.401) saw the new release (7.402), and I authorized it to take it because it is supposed to fix some e1000 driver issues with my Intel NIC.

Now I notice my ha log is filling up like crazy. Every second, it puts 10 lines like below:

2009:04:24-09:29:17 fw-2 ctsyncd: Got SIGUSR1, set status to SLAVE
2009:04:24-09:29:17 fw-2 ctsyncd: Got SIGUSR1, set status to SLAVE
2009:04:24-09:29:17 fw-2 ctsyncd: Got SIGUSR1, set status to SLAVE

fw-2 is the node 2 (slave). Anybody else seeing that?


This thread was automatically locked due to age.
Parents
  • Liug, what's the status on this problem?  What did Support tell you?
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • They are not sure and need to ssh to the box to do some more research. We will arrange for that and see.
  • Please ask support for a fix of ctsyncd (Mantis ID #10323). This will be fixed in v7.403.
  • They are not sure and need to ssh to the box to do some more research. We will arrange for that and see.


    They sshed into the box, re-initialized the postgresql database, which got rid of the error:

    ERROR cannot get sl_local_node_id - ERROR: schema "_asg_cluster" does not exist

    They also installed the new version of ctsyncd, which quieted down the ha logs.

    Now looking at the last few days of cpu graph, I can see it is constantly low, except that at around 2:15-2:30AM, it has one big spike node 1 (master), every day. My guess is it must be some scheduled job. Does anybody else notice this? My problem is when this happens, node 1 will miss some heartbeat from node 2 (slave) and thinks node 2 is dead, then it will get the beat again, and re-add node 2 into the cluster. So every night I am still getting those HA alerts.
  • That is the nightly PostgreSQL database rollup.  Have you considered adding RAM to your device?
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • That is the nightly PostgreSQL database rollup.  Have you considered adding RAM to your device?


    I have enough RAM, and it is only 20% used, flat. Not even a single spike over the last few weeks.
  • Last night, it was crazy. I got 30+ email alerts.
    I guess it must be the month end report generating that caused the cpu spike, and makes the packet loss for the heartbeat link.
    Astaro is a security firewall firstly. Shouldn't the reporting work be in low priority? Letting it affect firewall/cluster is bad. 
    Maybe astaro should consider to make it run "nicer", or offer an option to offload the postgresql/reporting job to another "management machine", rather than on the live firewall.
  • Same Problem here, when is the 7.403 expected?
    This is not good, today we had 100% cpu load on one of the nodes and the network-connection broke, very bad as this system is located in egypt [:(]
  • That is the nightly PostgreSQL database rollup.  Have you considered adding RAM to your device?


    I did try your advice though the system already had 2G.
    I added a few more DIMMs and it now has 8G. Unfortunately, though BIOS shows/detects all the 8G during booting, ASG kernel doesn't seem to support PAE, thus can only see/use 3.5G.
    Anyway, RAM upgrade doesn't seem to help the nightly cpu spikes. Worse part is the cpu spike kills my HA heartbeat as I mentioned here https://community.sophos.com/products/unified-threat-management/astaroorg/f/52/t/26952
  • Can you try turning off HyperThreading?

    I know that sounds random, but so does your problem.
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • Hi,

    i´ve got the same situation here with my ASG 220 Cluster since updating on 7.402

    But i´ve no performance bottlenecks, only the logs getting filled and the second node seemed not to be updated as it should be

    the up2date log shows up as follows: 

    2009:05:28-00:19:01 FW2-2 audld[1958]: >=========================================================================
    2009:05:28-00:19:01 FW2-2 audld[1958]: running on HA slave system or cluster node, exiting
    2009:05:28-00:19:01 FW2-2 audld[1958]: 
    2009:05:28-00:19:01 FW2-2 audld[1958]:  1. main::run:190() audld.pl
    2009:05:28-00:19:01 FW2-2 audld[1958]:  2. main::top-level:33() audld.pl
    2009:05:28-00:20:02 FW2-2 auisys[2009]: Starting Up2Date Package Installer (Version 1.65)
    2009:05:28-00:20:02 FW2-2 auisys[2009]: Searching for available up2date packages for type 'ips'
    2009:05:28-00:20:02 FW2-2 auisys[2009]: id="371D" severity="info" sys="system" sub="up2date" name="No up2date packages available for installation" status="failed" action="preinst_check" package="ips"
    2009:05:28-00:18:01 FW2-1 audld[17574]: Starting Up2Date Package Downloader (Version 1.57)
    2009:05:28-00:20:07 FW2-2 auisys[2009]: Searching for available up2date packages for type 'avira'
    2009:05:28-00:20:07 FW2-2 auisys[2009]: Installing up2date package file '/var/up2date//avira/u2d-avira-7.734-735.patch.tgz.gpg'
    2009:05:28-00:20:07 FW2-2 auisys[2009]: Verifying up2date package signature
    2009:05:28-00:20:07 FW2-2 auisys[2009]: Unpacking installation instructions
    2009:05:28-00:20:08 FW2-2 auisys[2009]: Unpacking up2date package container
    2009:05:28-00:20:08 FW2-2 auisys[2009]: Running pre-installation checks
    2009:05:28-00:20:08 FW2-2 auisys[2009]: Starting up2date package installation
    2009:05:28-00:20:08 FW2-2 auisys[2009]: >=========================================================================
    2009:05:28-00:20:08 FW2-2 auisys[2009]: Failed testing RPM installation (command: 'rpm --test -U /var/up2date//avira-install/u2d-avira-7.735/rpms/u2d-avira-7.734-735.patch.rpm')
    2009:05:28-00:20:08 FW2-2 auisys[2009]: 
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  1. Internal::Systemstep::real_installation:2292() auisys.pl
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  2. main:[:P]erform_work:919() auisys.pl
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  3. main::auisys_prepare_and_work:496() auisys.pl
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  4. main::top-level:33() auisys.pl
    2009:05:28-00:20:08 FW2-2 auisys[2009]: |=========================================================================
    2009:05:28-00:20:08 FW2-2 auisys[2009]: Error details:
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  (stdout):$VAR1 = [];
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  (stderr):$VAR1 = [
    2009:05:28-00:20:08 FW2-2 auisys[2009]:           'error: Failed dependencies:
    2009:05:28-00:20:08 FW2-2 auisys[2009]: ',
    2009:05:28-00:20:08 FW2-2 auisys[2009]:           ' u2d-avira = 7-734 is needed by u2d-avira-7-735
    2009:05:28-00:20:08 FW2-2 auisys[2009]: '
    2009:05:28-00:20:08 FW2-2 auisys[2009]:         ];
    2009:05:28-00:20:08 FW2-2 auisys[2009]: 
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  1. Internal::Systemstep::real_installation:2293() auisys.pl
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  2. main:[:P]erform_work:919() auisys.pl
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  3. main::auisys_prepare_and_work:496() auisys.pl
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  4. main::top-level:33() auisys.pl
    2009:05:28-00:20:08 FW2-2 auisys[2009]: |=========================================================================
    2009:05:28-00:20:08 FW2-2 auisys[2009]: id="371O" severity="error" sys="system" sub="up2date" name="Fatal: Up2Date package installation failed: An error occured during the RPM pre-installation test (1)" status="failed" action="install" code="1" package="avira"
    2009:05:28-00:20:08 FW2-2 auisys[2009]: 
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  1. main::alf:71() auisys.pl
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  2. main:[:P]erform_work:965() auisys.pl
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  3. main::auisys_prepare_and_work:496() auisys.pl
    2009:05:28-00:20:08 FW2-2 auisys[2009]:  4. main::top-level:33() auisys.pl


    and the ha-log shows severals entries within a minute

    2009:05:28-00:02:35 FW2-2 ctsyncd: Got SIGUSR1, set status to SLAVE
    2009:05:28-00:02:35 FW2-2 ctsyncd: Got SIGUSR1, set status to SLAVE


    Any ideas?



    CU
    Thomas
  • Hi Thomas,

    Astaro support fixed this problem in my 2xASG320 Cluster.
Reply Children