[8.900][CLOSED] UTM Beta 9.0 falls over after 1day

I got everything installed and working on the beta 9.0 and then today none of my boxes can touch the net. My iphone can though.....
Parents
  • High availability at home is pointless. Specially if you are already virtualizing. This beta has been fairly stable and not saying kernel panics are impossible but probably points to a misconfiguration in your esxi. I personally have never seen any of my systems just "laying down" on ANY version or beta I have ever used physical or virtual. 
    A daemon misbehaving.... sure. Linux kernel laying down, not likely without faulty hardware.
  • So going through the HA Log looks like the master just didn't send a heartbeat for bit

    2012:03:05-14:03:29 phoenix-2 ha_daemon[5358]: id="38C1" severity="info" sys="System" sub="ha" name="Node 1 is dead, received no heart beats!"
    2012:03:05-14:03:29 phoenix-2 ha_daemon[5358]: id="38B5" severity="info" sys="System" sub="ha" name="Master is dead, taking over!"
    2012:03:05-14:03:29 phoenix-2 ha_daemon[5358]: id="38B0" severity="info" sys="System" sub="ha" name="Switching to Master mode"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A1" severity="warn" sys="System" sub="ha" name="Another master around!"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A0" severity="info" sys="System" sub="ha" name="Node 2 changed mode: SLAVE -> MASTER"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A1" severity="warn" sys="System" sub="ha" name="Another master around!"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A1" severity="warn" sys="System" sub="ha" name="Another master around!"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A1" severity="warn" sys="System" sub="ha" name="Another master around!"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A1" severity="warn" sys="System" sub="ha" name="Another master around!"
    2012:03:05-14:03:30 phoenix-2 ha_daemon[5358]: id="38A0" severity="info" sys="System" sub="ha" name="Activating sync process for database on node 1"


    Not sure why but whatever its all back to normal now.
Reply
  • So going through the HA Log looks like the master just didn't send a heartbeat for bit

    2012:03:05-14:03:29 phoenix-2 ha_daemon[5358]: id="38C1" severity="info" sys="System" sub="ha" name="Node 1 is dead, received no heart beats!"
    2012:03:05-14:03:29 phoenix-2 ha_daemon[5358]: id="38B5" severity="info" sys="System" sub="ha" name="Master is dead, taking over!"
    2012:03:05-14:03:29 phoenix-2 ha_daemon[5358]: id="38B0" severity="info" sys="System" sub="ha" name="Switching to Master mode"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A1" severity="warn" sys="System" sub="ha" name="Another master around!"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A0" severity="info" sys="System" sub="ha" name="Node 2 changed mode: SLAVE -> MASTER"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A1" severity="warn" sys="System" sub="ha" name="Another master around!"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A1" severity="warn" sys="System" sub="ha" name="Another master around!"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A1" severity="warn" sys="System" sub="ha" name="Another master around!"
    2012:03:05-14:04:18 phoenix-1 ha_daemon[12972]: id="38A1" severity="warn" sys="System" sub="ha" name="Another master around!"
    2012:03:05-14:03:30 phoenix-2 ha_daemon[5358]: id="38A0" severity="info" sys="System" sub="ha" name="Activating sync process for database on node 1"


    Not sure why but whatever its all back to normal now.
Children
No Data