This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

double executive reports

Hi there,

we've got some problems after updating our HA Cluster of two nodes to version 7.201 from 7.103. The update procedure went fine, but now we get every report (daily, weekly, monthly) twice. That means, every node sends its own report whereby the superflous report (slave nodes) stops in diagramms at same time when the system was updated.

So we restarted the slave but it brought no adjustment.

Is this a bug or could it because the node 1 was the master before update procedure, after it, the roles changed!?

Any one a solution? Maybe Master restart (but that will be the last alternative for us)?


greetings
eserzet


This thread was automatically locked due to age.
Parents
  • What you describe sounds similar to a known issue:
    In 7.20x, the Confd master process may sometimes neglect to enforce Confd client reload after snapshot restore operations.  This will be fixed in 7.300, my fix is currently under QA testing.
     
    Initial HA/Cluster slave synchronisation uses snapshot restore, so the problem might show up here.
     
     

    So we restarted the slave but it brought no adjustment.

     
    Probably, that won't help - it might just run into the same race condition once again.
     

    Is this a bug or could it because the node 1 was the master before update procedure, after it, the roles changed!?

     
    Yes and yes, probably; there is a bug, and the problem is that the settings on the slave may fail to fully synchronise.
     

    Any one a solution?
    Maybe Master restart (but that will be the last alternative for us)?

     
    No! Do not touch the master!
    Your master is almost certainly fine, restarting it probably won't achieve anything except disrupting your service.
     
    As a workaround, change some arbitrary HA parameter on the slave.
    For example, type the following as root ON THE SLAVE ONLY:
     
     # cc set ha virtual_mac 0
     # cc set ha virtual_mac 1
     
    This should make the MiddleWare clean up the HA/Cluster state on the slave.
     
    A more drastic measure (also, on the slave only!) would be
     
     # rm -f /var/confd/var/storage/client/*
     # /etc/init.d/mdw restart
     
    but probably that's not necessary.
  • Hi,

    # cc set ha virtual_mac 0
    # cc set ha virtual_mac 1

    on slave fixed our problem!

    Thx a lot,

    greetz
Reply Children
No Data