This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

HA

Hello, after restart astaro I still get this message in live log.
2014:11:24-10:31:56 mail-2 repctld[22797]: [e] do_monitor(1537): cannot get local database status

2014:11:24-10:32:56 mail-2 repctld[22797]: [e] db_connect(2554): error while connecting to database: could not connect to server: No such file or directory
2014:11:24-10:32:56 mail-2 repctld[22797]: [c] local_connection(2500): cannot connect to local database: could not connect to server: No such file or directory
2014:11:24-10:32:56 mail-2 repctld[22797]: [e] do_monitor(1537): cannot get local database status
2014:11:24-10:33:56 mail-2 repctld[22797]: [e] db_connect(2554): error while connecting to database: could not connect to server: No such file or directory
2014:11:24-10:33:56 mail-2 repctld[22797]: [c] local_connection(2500): cannot connect to local database: could not connect to server: No such file or directory
2014:11:24-10:33:56 mail-2 repctld[22797]: [e] do_monitor(1537): cannot get local database status
2014:11:24-10:34:56 mail-2 repctld[22797]: [e] db_connect(2554): error while connecting to database: could not connect to server: No such file or directory
2014:11:24-10:34:56 mail-2 repctld[22797]: [c] local_connection(2500): cannot connect to local database: could not connect to server: No such file or directory
2014:11:24-10:34:56 mail-2 repctld[22797]: [e] do_monitor(1537): cannot get local database status
2014:11:24-10:35:56 mail-2 repctld[22797]: [e] db_connect(2554): error while connecting to database: could not connect to server: No such file or directory
2014:11:24-10:35:56 mail-2 repctld[22797]: [c] local_connection(2500): cannot connect to local database: could not connect to server: No such file or directory
2014:11:24-10:35:56 mail-2 repctld[22797]: [e] do_monitor(1537): cannot get local database status
2014:11:24-10:36:53 mail-2 repctl[22790]: [e] db_connect(2554): error while connecting to database: could not connect to server: No such file or directory
2014:11:24-10:36:53 mail-2 repctl[22790]: [c] local_connection(2500): cannot connect to local database: could not connect to server: No such file or directory
2014:11:24-10:36:53 mail-2 repctl[22790]: [w] recheck(1251): re-initialising replication
2014:11:24-10:36:53 mail-2 repctl[22790]:  execute(2181): pg_ctl: no server running
2014:11:24-10:36:53 mail-2 ha_daemon[3819]: id="38A0" severity="info" sys="System" sub="ha" name="Activating sync process for database on node 1"
2014:11:24-10:36:53 mail-2 repctl[22790]:  execute(2181): pg_ctl: PID file "/var/storage/pgsql92/data/postmaster.pid" does not exist
2014:11:24-10:36:54 mail-2 repctl[22790]:  start_backup_mode(882): starting backup mode at 00000001000000830000004C
2014:11:24-10:36:54 mail-2 ha_daemon[3819]: id="38A0" severity="info" sys="System" sub="ha" name="Activating sync process for database on node 1"
2014:11:24-10:36:54 mail-2 repctl[22790]:  execute(2181): rsync: failed to connect to 198.19.250.1: Connection refused (111)
2014:11:24-10:36:54 mail-2 repctl[22790]: [c] standby_clone(1064): rsync failed on $VAR1 = {
2014:11:24-10:36:55 mail-2 repctl[22790]:  stop_backup_mode(903): stopped backup mode at 00000001000000830000004C
2014:11:24-10:36:55 mail-2 repctl[22790]: [c] standby_clone(1076): sync aborted
2014:11:24-10:36:55 mail-2 repctl[22790]: [e] prepare_secondary(578): clone failed
2014:11:24-10:36:55 mail-2 repctl[22790]:  start_backup_mode(882): starting backup mode at 00000001000000830000004E
2014:11:24-10:36:55 mail-2 ha_daemon[3819]: id="38A0" severity="info" sys="System" sub="ha" name="Activating sync process for database on node 1"
2014:11:24-10:36:55 mail-2 repctl[22790]:  execute(2181): rsync: failed to connect to 198.19.250.1: Connection refused (111)
2014:11:24-10:36:55 mail-2 repctl[22790]: [c] standby_clone(1064): rsync failed on $VAR1 = {
2014:11:24-10:36:56 mail-2 repctld[22797]: [e] db_connect(2554): error while connecting to database: could not connect to server: No such file or directory
2014:11:24-10:36:56 mail-2 repctld[22797]: [c] local_connection(2500): cannot connect to local database: could not connect to server: No such file or directory
2014:11:24-10:36:56 mail-2 repctld[22797]: [e] do_monitor(1537): cannot get local database status
2014:11:24-10:36:56 mail-2 repctl[22790]:  stop_backup_mode(903): stopped backup mode at 00000001000000830000004E
2014:11:24-10:36:56 mail-2 repctl[22790]: [c] standby_clone(1076): sync aborted
2014:11:24-10:36:56 mail-2 repctl[22790]: [e] prepare_secondary(578): clone failed
2014:11:24-10:36:57 mail-2 repctl[22790]:  start_backup_mode(882): starting backup mode at 000000010000008300000050
2014:11:24-10:36:57 mail-2 ha_daemon[3819]: id="38A0" severity="info" sys="System" sub="ha" name="Activating sync process for database on node 1"
2014:11:24-10:36:57 mail-2 repctl[22790]:  execute(2181): rsync: failed to connect to 198.19.250.1: Connection refused (111)
2014:11:24-10:36:57 mail-2 repctl[22790]: [c] standby_clone(1064): rsync failed on $VAR1 = {
2014:11:24-10:36:58 mail-2 repctl[22790]:  stop_backup_mode(903): stopped backup mode at 000000010000008300000050
2014:11:24-10:36:58 mail-2 repctl[22790]: [c] standby_clone(1076): sync aborted
2014:11:24-10:36:58 mail-2 repctl[22790]: [e] prepare_secondary(578): clone failed
2014:11:24-10:36:58 mail-2 repctl[22790]: [c] prepare_secondary(590): failed to get database up, waiting for retry
2014:11:24-10:36:58 mail-2 repctl[22790]: [e] start_monitor(1438): refusing to start second monitor process
2014:11:24-10:36:58 mail-2 repctl[22790]:  setup_replication(232): checkinterval 300 [/CODE]
Configuration of HA is attach in screens.


This thread was automatically locked due to age.
  • Is it stuck syncing? DB could be corrupt, I had this same issue.  

    The fix was to remove the slave from HA (basically turn off HA). The slave should shutdown, when it you power it back on it will be factory defaults, turn HA back on before you power it back on.  It should then sync and be happy again.
  • If I understand,
    I have to change in HA/configuration/Operation Mode to off.
    Then shutdown the slave astaro and power it again and set Operation mode back to Hot-standby?
  • ...as Ross said:
    Turn HA off....it will alert you that slave will go off (shutdown) and it will perform factory reset on slave. everything should be done without your additional actions
    Turn back on HA on "master" (choose Automatically).
    Start slave and HA will sync from scratch.
  • Thank, I hope thi not will shutdown all network. I need to be primary astaro running. Or should I do this at evening.
  • I would do it out of hours just to be safe [:)]
  • Ok weekend will be good time for this :-)
    Ps: Last question
    should I unplug all ehternet cables from slave except HA link?

    Hello,
    I found this how to repair db and it works.

    Hello ,

    You can try to rebuild the DB which may get it going again.

    In version 9.100 and newer on systems using High Availability, run the commands below on both the master and the slave.

    Open 2 putty sessions, log into the utm and escalate both to root user.
    Then on the second, run 'ha_utils ssh'  to connect to the slave, authenticate as loginuser, and switch to root again.

    then on both master and slave, run the commands below:

    killall repctl
    /etc/init.d/postgresql92 rebuild
    repctl

    After this, the reports will begin to rebuild and hopefully the DB problems will be eliminated.

    I hope this will be usefull.