Guest User!

You are not Sophos Staff.

[9.171][NOTREPROD] SUM continually getting Connection to device has been lost

Hi All
Since moving to 9.1 I'm continually getting to below message from externally connected devices to my SUM.
"Connection to device has been lost (ping timeout)".
My SUM device is connected through my firewall with a NAT rule.

My old 9.0 is a Virtual and the new 9.1 is a copy of the old Virtual with a import of the old configuration and patched to 9.171. So the only things changed is within 9.1.

I can turn on the old 9.0 (and 9.1 off) and all is fine.

Mark
Parents
  • Hi Bianca
    With 9.171 running I've got 81 emails in 22hrs saying 
    [INFO-901] Device went offline Date Sun, 01 Dec 2013 11:27:10 +1100
    and then 
    [INFO-903] Device came online Date Sun, 01 Dec 2013 11:27:11 +1100

    With 9.0 and the same config I don't get these.
    SUM output
    2013:12:01-11:27:10 sum accd: 176533603 [0xe03f6b70] WARN  server.device.DeviceSession null - DeviceSession::clear() IO error during recv [device;guid:16F30520-9D8B-11E2-BE8F-C4D86F7D7947;ip:115.70.206.10;name[:D]ingo]
    2013:12:01-11:27:10 sum accd: 176533609 [0xe03f6b70] INFO  server.device.DeviceCache null - DeviceCache::logout() device ... [device;guid:16F30520-9D8B-11E2-BE8F-C4D86F7D7947;ip:115.70.206.10;name[:D]ingo]
    2013:12:01-13:23:41 sum accd: 183524588 [0xf2f28b70] WARN  server.device.CheckPingAction null - 2 missed ping(s) device 16F30520-9D8B-11E2-BE8F-C4D86F7D7947
    2013:12:01-13:24:11 sum accd: 183554588 [0xf2527b70] WARN  server.device.CheckPingAction null - 3 missed ping(s) device 16F30520-9D8B-11E2-BE8F-C4D86F7D7947
    2013:12:01-13:24:11 sum accd: 183554588 [0xf2527b70] ERROR server.device.CheckPingAction null - device [device;guid:16F30520-9D8B-11E2-BE8F-C4D86F7D7947;ip:115.70.206.10;name[:D]ingo] missed 3 pings => disconnecting
    2013:12:01-13:24:11 sum accd: 183554638 [0xe03f6b70] WARN  server.device.DeviceSession null - DeviceSession::clear() IO error during recv [device;guid:16F30520-9D8B-11E2-BE8F-C4D86F7D7947;ip:115.70.206.10;name[:D]ingo]
    2013:12:01-13:24:11 sum accd: 183554706 [0xf2527b70] INFO  server.device.DeviceCache null - DeviceCache::logout() device ... [device;guid:16F30520-9D8B-11E2-BE8F-C4D86F7D7947;ip:115.70.206.10;name[:D]ingo]
    2013:12:01-13:30:16 sum accd: 183919587 [0xe2bfbb70] WARN  server.device.CheckPingAction null - 2 missed ping(s) device 16F30520-9D8B-11E2-BE8F-C4D86F7D7947
    2013:12:01-13:30:46 sum accd: 183949587 [0xead18b70] WARN  server.device.CheckPingAction null - 3 missed ping(s) device 16F30520-9D8B-11E2-BE8F-C4D86F7D7947
    2013:12:01-13:30:46 sum accd: 183949587 [0xead18b70] ERROR server.device.CheckPingAction null - device [device;guid:16F30520-9D8B-11E2-BE8F-C4D86F7D7947;ip:115.70.206.10;name[:D]ingo] missed 3 pings => disconnecting
    2013:12:01-13:30:46 sum accd: 183949593 [0xe03f6b70] WARN  server.device.DeviceSession null - DeviceSession::clear() IO error during recv [device;guid:16F30520-9D8B-11E2-BE8F-C4D86F7D7947;ip:115.70.206.10;name[:D]ingo]
    2013:12:01-13:30:46 sum accd: 183949597 [0xead18b70] INFO  server.device.DeviceCache null - DeviceCache::logout() device ... [device;guid:16F30520-9D8B-11E2-BE8F-C4D86F7D7947;ip:115.70.206.10;name[:D]ingo]

    External Host Ping test from SUM.

    PING ***x.***x.***x.***x (***x.***x.***x.***x) 56(84) bytes of data.

    64 bytes from ***x.***x.***x.***x: icmp_seq=1 ttl=50 time=14.9 ms

    64 bytes from ***x.***x.***x.***x: icmp_seq=2 ttl=50 time=13.4 ms

    64 bytes from ***x.***x.***x.***x: icmp_seq=3 ttl=50 time=13.8 ms

    64 bytes from ***x.***x.***x.***x: icmp_seq=4 ttl=50 time=14.2 ms

    64 bytes from ***x.***x.***x.***x: icmp_seq=5 ttl=50 time=27.3 ms

    Speed Test

    Speedtest.net by Ookla - My Results
  • Hi Mark,

    are you trying to connect the two UTMs with the same system_id to the SUM at the
    same time?

    From what I understood from your first post, you are not. You turned off the 9.0 and only
    tried to connect the new 9.1 to the SUM, right?

    If so, then it's not a problem that the new UTM has the same system_id. It's a problem
    when you try to connect both to the SUM as only one, i.e. the one that connects first,
    will be accepted by SUM. Any further UTM with that id won't be accepted.

    Regards, Hakan
  • Hi Mark,

    according to the SUMs log file portion your UTM was disconnected by the SUM because
    of ping timeouts at:

    2013:12:01-11:27:10
    2013:12:01-13:24:11
    2013:12:01-13:30:46

    Could you please check on your UTM what happened at that points in time, e.g. in the
    device-agent.log file?

    Regards, Hakan
Reply Children
No Data