[7.470][BUG][NOTABUG] Error message in the HA log even after both nodes are active

Hi

I've setup 2 nodes using the autoconfig mode for HA...

then during the syncing of node 2 I was having these errors:


2009:07:11-23:11:14 asg450a-2 slon[8810]: [1-1] CONFIG main: slon version 1.2.15 starting up
2009:07:11-23:11:14 asg450a-2 slon[9173]: [2-1] ERROR cannot get sl_local_node_id - ERROR: schema "_asg_cluster" does not exist
2009:07:11-23:11:14 asg450a-2 slon[9173]: [3-1] FATAL main: Node is not initialized properly - sleep 10s
2009:07:11-23:11:14 asg450a-2 slon[9175]: [2-1] ERROR cannot get sl_local_node_id - ERROR: schema "_asg_cluster" does not exist
2009:07:11-23:11:14 asg450a-2 slon[9175]: [3-1] FATAL main: Node is not initialized properly - sleep 10s 


Probably normal as things are syncing ???? (but not sure)

Then status had changed after some minutes to active... but after that I still have that errors:


2009:07:11-23:34:12 asg450a-2 slon[4136]: [1-1] CONFIG main: slon version 1.2.15 starting up
2009:07:11-23:34:12 asg450a-2 slon[6081]: [2-1] ERROR cannot get sl_local_node_id - ERROR: schema "_asg_cluster" does not exist
2009:07:11-23:34:12 asg450a-2 slon[6081]: [3-1] FATAL main: Node is not initialized properly - sleep 10s 
[/code[

not sure this is really normal now ?

and I've a bunch of this !

thx
  • Astaro Beta Report
    --------------------------------
    Version: 7.470
    Type: BUG
    State: NOTABUG
    Reporter: BuBU
    Contributor: 
    MantisID: 
    --------------------------------
  • I've rebooted the master and I get also errors like that:


    2009:07:12-00:00:07 asg450a-1 slon[4087]: [2-1] FATAL main: write to worker pipe failed -(9) Bad file descriptor
    2009:07:12-00:00:11 asg450a-1 slon_control[3497]: Slonik error, process exited with value 255 
  • and


    2009:07:11-23:59:54 asg450a-2 slon[8149]: [6-1] FATAL localListenThread: "select ev_seqno, ev_timestamp, ev_minxid, ev_maxxid, ev_xip, ev_type, ev_data1,
    2009:07:11-23:59:54 asg450a-2 slon[8149]: [6-2] ev_data2, ev_data3, ev_data4, ev_data5, ev_data6, ev_data7, ev_data8 from "_asg_cluster".sl_event where ev_origin = '2'
    2009:07:11-23:59:54 asg450a-2 slon[8149]: [6-3] and ev_seqno > '91' order by ev_seqno" - ERROR: schema "_asg_cluster" does not exist 
  • this is a known issue in 7.404. to fix this you have to do following:

    on master and slave at the same time:

    killall slon_control
    slon_control -c

    then on master:

    psql -U postgres -c 'drop schema _asg_cluster cascade;' reporting
    psql -U postgres -c 'drop schema _asg_cluster cascade;' smtp
    psql -U postgres -c 'drop schema _asg_cluster cascade;' pop3

    then on slave:

    psql -U postgres -c 'drop schema _asg_cluster cascade;' reporting
    psql -U postgres -c 'drop schema _asg_cluster cascade;' smtp
    psql -U postgres -c 'drop schema _asg_cluster cascade;' pop3

    finally on master:

    slon_control

    finally on slave:

    slon_control

    if a error message appear like schema not exist or so one all is in the
    correct way. with the database commands we clarify that the complete schema is
    flushed.

    Greetings
    Andreas
  • ok fine... but should this still be the case on fresh 7.470 install ?

    I've just installed a new HA system and still have it... it will not be fixed for 7.500 ?

    what happen if we do not fix this manually ?

    thx
  • this should be fixed in the final 7.5 that if the error accure it will be fixed after 1 hour automatically by the system. I will take a look to our bug tracking system in which beta version the fix is included.

    Greetings
    Andreas