[7.910][BUG][FIXED] SIP proxy in cluster mode fails to allow voice in

Hi,

In cluster mode with SIP proxy turned on, cannot hear incoming callers voice but other party can hear my voice.  Turn off SIP proxy and traffic is processed OK.

Cheers,

Darren
  • Astaro Beta Report
    
    --------------------------------
    Version: 7.910
    Type: BUG
    State: CLOSED/FIXED
    Reporter: darrenl++
    Contributor: 
    MantisID: 13672
    Target version: 7.912
    Fixed in version: 7.912
    --------------------------------
  • Can you please post the output of iptables-save, and have a look at the packetfilter.log, if there are any suspicious things logged?
  • Update - it looks like the SIP proxy actually isn't intercepting/handling traffic at all in a proxy mode -  I noticed an entry in the packet filter rules that was allowing the SIP traffic out but not a return back into the network and therefore masked some of my initial troubleshooting.
    If that rule is disabled, the proxy should be handling the SIP traffic and it's not.
    Packet filter log is showing all incoming/outgoing SIP traffic as being dropped.

    18:38:26 Default DROP UDP
    217.10.79.30 : 13546

    X.X.X.X : 5006
    len=200 ttl=56 tos=0x00 srcmac=***X dstmac=***
    18:38:26 Default DROP UDP
    X.X.X.X : 5006

    217.10.79.30 : 13546
    len=200 ttl=249 tos=0x18 srcmac=*** dstmac=***X

    When checking the config daemon log when reactivating the SIP proxy this is what I see:

    2010:05:08-18:42:56 mercury-1 confd[6989]: I Storage::commit:344() => id="3100" severity="info" sys="System" sub="confd" name="internal commit" user="***X" srcip="10.10.0.80" sid="eaaZXPxQGaHSNxknwfvX" facility="webadmin" client="index.plx" storage="/cfg"
    2010:05:08-18:42:56 mercury-1 confd[3830]: I main::top-level:346() => id="310c" severity="info" sys="System" sub="confd" name="node changed" node="sip->status" value="1" oldvalue="0" user="***X" srcip="10.10.0.80" sid="eaaZXPxQGaHSNxknwfvX" facility="webadmin" client="index.plx" pid="6989"
    2010:05:08-18:42:56 mercury-1 confd[3830]: I main::top-level:564() => id="310n" severity="info" sys="System" sub="confd" name="applied changes" user="***X" srcip="10.10.0.80" sid="eaaZXPxQGaHSNxknwfvX" facility="webadmin" client="index.plx" pid="6989" version="388" storage="/cfg"
    2010:05:08-18:42:56 mercury-1 confd-sync[7358]: id="3850" severity="info" sys="System" sub="ha" name="Version changed: 388"
    2010:05:08-18:42:56 mercury-1 confd-sync[7358]: id="3850" severity="info" sys="System" sub="ha" name="Starting change sync to slave 198.19.250.2"
    2010:05:08-18:42:57 mercury-2 confd[31720]: I Role::authenticate:140() => id="3106" severity="info" sys="System" sub="confd" name="authentication successful" user="ha_sync" srcip="198.19.250.1" sid="LNtqmTlBgnlcRThBbLUq" facility="system" client="confd-sync" call="new"
    2010:05:08-18:42:57 mercury-2 confd[31720]: I Storage::commit:344() => id="3100" severity="info" sys="System" sub="confd" name="internal commit" user="ha_sync" srcip="198.19.250.1" sid="LNtqmTlBgnlcRThBbLUq" facility="system" client="confd-sync" storage="/cfg"
    2010:05:08-18:42:57 mercury-1 confd-sync[7358]: id="3850" severity="info" sys="System" sub="ha" name="Change synced to slave 198.19.250.2"
    2010:05:08-18:42:57 mercury-2 confd[4057]: I main::top-level:346() => id="310c" severity="info" sys="System" sub="confd" name="node changed" node="sip->status" value="1" oldvalue="0" user="ha_sync" srcip="198.19.250.1" sid="LNtqmTlBgnlcRThBbLUq" facility="system" client="confd-sync" pid="31720"
    2010:05:08-18:42:57 mercury-2 confd[4057]: I main::top-level:564() => id="310n" severity="info" sys="System" sub="confd" name="applied changes" user="ha_sync" srcip="198.19.250.1" sid="LNtqmTlBgnlcRThBbLUq" facility="system" client="confd-sync" pid="31720" version="722" storage="/cfg"
  • Urgh... tried to see if it was an issue with master node not correctly handing off to slave node, shut down slave node, issue remains.

    When I bought slave node back online, previously seen cluster database error has returned (defect - mantis ID 13639) :
    2010:05:08-18:54:58 mercury-2 slon[7296]: [30-1] ERROR cannot get sl_local_node_id - ERROR: schema "_asg_cluster" does not exist
    2010:05:08-18:54:58 mercury-2 slon[7296]: [30-2] LINE 1: select last_value::int4 from "_asg_cluster".sl_local_node_id
    2010:05:08-18:54:58 mercury-2 slon[7296]: [30-3] ^
    2010:05:08-18:54:58 mercury-2 slon[7296]: [31-1] FATAL main: Node is not initialized properly - sleep 10s
  • OK, error was cleaned during the early morning automated cleanup process however now master and slave nodes appear to have stopped syncing after initial sync according to the log file:

    2010:05:09-01:15:12 mercury-1 slon_control[4324]: Initial synchronization for node 2 finished!
    2010:05:09-01:15:12 mercury-1 ha_daemon[4163]: id="38A0" severity="info" sys="System" sub="ha" name="Deactivating sync process for database on node 2"
    2010:05:09-01:15:27 mercury-2 ha_daemon[4368]: id="38A0" severity="info" sys="System" sub="ha" name="Initial synchronization finished!"
    2010:05:09-01:15:28 mercury-1 ha_daemon[4163]: id="38A0" severity="info" sys="System" sub="ha" name="Node 2 changed state: SYNCING -> ACTIVE"
  • Cluster environment seems to have stabilised but SIP proxy is still not working.
  • Darren, can you please post the output of iptables-save?
  • Thanks Darren, da_merlin has taken a look at it and he has found the problem.
  • WORKAROUND:

    Edit /etc/modprobe.d/netfilter on both nodes and
    replace ip_conntrack_sip by nf_conntrack_sip, reboot afterwards