This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

UTM220 and software appliance (ESXi) HA

Dear all,

I had to decommission our old ASG220 the other day and now I am trying to replace this Active-Passive SLAVE node with a software appliance on ESXi 5.5.

MASTER
UTM220, firmware updated to 9.203-3, HA turned off and on again, manual configuration to HotStandby, eth3/node ID 1

SLAVE
Software appliance (on ESXi/vCenter 5.5, 10GbE uplinks), firmware updated to 9.203-3, 8 interfaces VMXNET3 (eth0-eth7), manual configuration to HotStandby, eth3/node ID 2

When I connect eth3 of the VM to the network, HA on MASTER finds the new appliance, access is granted and configuratiom is being copied over, but after a few seconds the VM gets shut down and powered off:

2014:06:25-12:44:36 mail-1 ha_daemon[4175]: id="38A0" severity="info" sys="System" sub="ha" name="Access granted to remote node 2!"
2014:06:25-12:45:11 mail-1 ha_daemon[4175]: id="38A0" severity="info" sys="System" sub="ha" name="Node 2 joined with version 9.203003"
2014:06:25-12:45:11 mail-1 ha_daemon[4175]: id="38C0" severity="info" sys="System" sub="ha" name="Node 2 is alive!"
2014:06:25-12:45:11 mail-1 ha_daemon[4175]: id="38A0" severity="info" sys="System" sub="ha" name="Node 2 changed state: DEAD -> SYNCING"
2014:06:25-12:45:12 mail-1 repctl[10602]:  daemonize_check(1864): trying to signal daemon
2014:06:25-12:46:15 mail-2 ha_daemon[4073]: id="38A0" severity="info" sys="System" sub="ha" name="--- Node is disabled ---"
2014:06:25-12:46:15 mail-2 ha_daemon[4073]: id="38A0" severity="info" sys="System" sub="ha" name="HA daemon shutting down"
2014:06:25-12:46:16 mail-2 repctld[7026]: [w] master_connection(2428): check_dbh: -1
2014:06:25-12:46:17 mail-1 ha_daemon[4175]: id="38C1" severity="info" sys="System" sub="ha" name="Node 2 is dead, received no heart beats!"
2014:06:25-12:46:18 mail-1 repctl[10718]:  daemonize_check(1864): trying to signal daemon
2014:06:25-12:46:19 mail-2 repctld[7026]: [e] db_connect(2551): timeout while connecting to database
2014:06:25-12:46:19 mail-2 repctld[7026]: [e] master_connection(2458): (timeout)
2014:06:25-12:46:20 mail-2 repctl[4273]: [e] do_kill(1735): pid 7026 not terminated after 5 seconds - sending KILL
2014:06:25-12:46:20 mail-2 repctl[4273]:  execute(2181): waiting for server to shut down...
2014:06:25-12:46:20 mail-2 repctl[4273]:  execute(2181): .
2014:06:25-12:46:21 mail-2 repctl[4273]:  execute(2181):  done
2014:06:25-12:46:21 mail-2 repctl[4273]:  execute(2181): waiting for server to start....
2014:06:25-12:46:22 mail-2 repctl[4273]:  execute(2181):  done
2014:06:25-12:46:25 mail-2 repctl[4273]: [e] db_connect(2551): timeout while connecting to database
2014:06:25-12:46:25 mail-2 repctl[4273]: [e] master_connection(2458): (timeout)[/CODE]

It seems the MASTER gets no heart-beat signal from the SLAVE (VM). I successfully checked all (but one) of the NICs on the VM for their subnet connectivity, each eth interface on the UTM220 corresponds with the same eth interface number on the VM.

Is it possible at all to have a licensed/supported HotStandby (Active-Passive) cluster configuration with one hardware appliance and a one software appliance at all, and if so, what exactly am I doing wrong here?

Thanks so much in advance for your hints.

Cheers!


This thread was automatically locked due to age.
Parents Reply Children
  • Thanks, Bob, for clearing this up!

    Btw. I managed to get the old ASG 220 back to life by wiping all partitions and afterwards reinstalling with 9.000, then replacing the memory (now 2 GB), updating to 9.203-3 (an incredible amount of patches [:(] ) and putting the device back to work in the cluster. As a precaution I imaged the machine after a factory reset once it was up at the current patch level.

    Cheers!