Guest User!

You are not Sophos Staff.

This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Reporting DB error in HA mode

Hello guys,

we got two HA nodes with ASG 7.4 since yesterday evening. (Tonight we became two mails with subjects: 1. Database Conversion Started 2. Database Conversion Finished)

After unfortunately powerloss (7:40 this morning) of the slave our reporting database seems to be corrupted and no more diagrams will be created in mail security.

These messages appears every few seconds in the HA log:


2009:03:18-13:02:51 ***-1 slon[6543]: [1-1] CONFIG main: slon version 1.2.15 starting up
2009:03:18-13:02:51 ***-1 slon[10030]: [2-1] ERROR cannot get sl_local_node_id - ERROR: schema "_asg_cluster" does not exist
2009:03:18-13:02:51 ***-1 slon[10030]: [3-1] FATAL main: Node is not initialized properly - sleep 10s
2009:03:18-13:02:53 ***-1 slon[6547]: [407-1] ERROR remoteListenThread_2: "select "_asg_cluster".registerNodeConnection(1); listen "_asg_cluster_Event"; " - ERROR: schema
2009:03:18-13:02:53 ***-1 slon[6547]: [407-2] "_asg_cluster" does not exist
2009:03:18-13:02:53 ***-2 slon[23353]: [1-1] CONFIG main: slon version 1.2.15 starting up
2009:03:18-13:02:53 ***-2 slon[30434]: [2-1] ERROR cannot get sl_local_node_id - ERROR: schema "_asg_cluster" does not exist
2009:03:18-13:02:53 ***-2 slon[30434]: [3-1] FATAL main: Node is not initialized properly - sleep 10s
2009:03:18-13:02:59 ***-2 slon[23354]: [285-1] ERROR remoteListenThread_1: "select "_asg_cluster".registerNodeConnection(2); unlisten "_asg_cluster_Event"; " - ERROR: schema
2009:03:18-13:02:59 ***-2 slon[23354]: [285-2] "_asg_cluster" does not exist 


Months ago we had similar problems with such messages in HA log and got also that strange behavior with no more creation of diagrams. At that time, we were in connection with the Astaro support by mail and they gave us that hint to rebuild the db:


restore schema asg_cluster

killall slon_control (on master and slave)
slon_control -c (on master and slave)
slon_control (on master and slave)


But this isn't working anymore.


Thanks for your help.
eserzet


This thread was automatically locked due to age.
Parents Reply Children
  • no i hoped this time this would be the faster and better way to solve my problem...

    hey but my problem seems to be solved at 16:05 o'clock. HA log at this time:

    2009:03:18-16:05:58 ***-1 slon_control[3881]: Selfcheck for reporting with lag: -1
    
    2009:03:18-16:05:58 ***-1 slon_control[3881]: Killing slon reporting [6543]
    2009:03:18-16:05:59 ***-1 slon_control[3881]: Slonik returned error 65280
    2009:03:18-16:05:59 ***-1 slon_control[3881]: Resetting reporting
    2009:03:18-16:05:59 ***-1 slon_control[3881]: Starting replication from Node 2 to 1



    Now are no more asg_cluster does not exist messages on each nodes logs.

    Maybe the ASG can now fix that problem by itself??

    cheers
  • really annoying: still postgres proccess between 50 and 100 % cpu load and avg. wa 50 %

    AND mail statistics diagram isnt creating again but no error messages in logs.

    top


    USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
    root         1  0.0  0.0    720   280 ?        S    Mar17   0:05 init [3]  
    .
    .
    .
    root      1033 18.5  0.0      0     0 ?        Z    08:41   0:00      \_ [confd.plx] 
    root      3033  0.5  0.5  14032 11044 ?        Ss   Mar17  13:30 dns-resolver.plx
    root      3053  0.0  0.2   8208  5240 ?        S    Mar17   0:02 /usr/local/bin/sysmond
    root      3100  0.0  0.4  15816 10204 ?        Ss   Mar17   1:08 /var/aua/aua.bin
    root      1012  0.3  0.0      0     0 ?        Z    08:41   0:00  \_ [aua.bin] 
    root      1013  0.2  0.0      0     0 ?        Z    08:41   0:00  \_ [aua.bin] 
    root      3199  0.0  0.0   1808   720 ?        Ss   Mar17   0:00 /usr/sbin/cron
    root     16617  0.0  0.0   1836   528 ?        S    Mar18   0:00  \_ /usr/sbin/cron
    root     16618  0.0  0.3  11716  8128 ?        Ss   Mar18   0:00  |   \_ /usr/local/bin/adbs-maintenance.plx
    root      1520  0.0  0.0   1840   600 ?        S    02:30   0:00  \_ /usr/sbin/cron
    root      1522  0.0  0.2   9760  6204 ?        SNs  02:30   0:00  |   \_ /usr/local/bin/rotate_adbs.plx
    root      2130  0.0  0.0      0     0 ?        Z    02:39   0:00  |   \_ [sendmail] 
    root      2437  0.0  0.0   1832   568 ?        S    02:47   0:00  \_ /usr/sbin/cron
    root      2439  0.0  0.8  21552 17920 ?        SNs  02:47   0:00  |   \_ /usr/local/bin/gen_inline_reporting_data.plx
    root     19947  0.0  0.0   1836   568 ?        S    06:40   0:00  \_ /usr/sbin/cron
    root     19948  0.0  0.3  11712  8172 ?        Ss   06:40   0:00      \_ /usr/local/bin/adbs-maintenance.plx
    root      3325  0.0  0.2   4160  4160 ?        S