Guest User!

You are not Sophos Staff.

This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Losing internet connection frequently

Hello everybody,
I have a problem with my Sophos UTM that I haven't been able to figure out.
It is losing internet connectivity on a highly regular basis, sometimes for just 10 seconds, other times for up to 2 minutes.
I have tried the following:

  • reset everything to default and start over fresh
  • use a different ethernet port as my WAN port
  • changed the WAN ethernet cable

None of the above fixed my problem.

My setup is this:
Internet -> cable modem (this device has the actual external IP address) -> Sophos UTM -> Netgear switch.
Between the cable modem and the UTM is a private network, there are no other devices connected directly to the cable modem. Of course, this private network is a different subnet than the private network on the LAN side of the UTM.

I found that I could keep pinging 8.8.8.8 from a wireless device (temporarily) connected to the cable modem's wifi when one the connectivity problems occurred, so the cable modem itself is not the problem. Without the UTM in the middle, connectivity remains stable.

Output of the version command:
Current software version...: 9.315002
Hardware type..............: 320C
Serial number..............: A1303A39******x
Installation image.........: 9.314-13.1
Installation type..........: ssi
Installed pattern version..: 86769
Downloaded pattern version.: 86769
Up2Dates applied...........: 1 (see below)
                             sys-9.314-9.315-13.2.1.tgz (Aug  7 03:00)
Up2Dates available.........: 0
Factory resets.............: 2
Timewarps detected.........: 1

It is an older Astaro Security Gateway 320, not one of the more handsome white Sophos appliances.
I'm using a home license and I deleted 1 line from the /etc/asg file to allow the installation of this license.
Other than that, I never changed anything from the command line.

Is there anyone who can help me figure this out and fix it?

Here are some entries from some logs that indicate there is no connectivity:
/var/log/mdw.log:
2015:08:28-12:33:05 myutm middleware[4160]: [WARN-032] Internet uplink is down
2015:08:28-12:33:30 myutm middleware[4160]: T modules::ipset:[:D]eleteUnused:320() => auto#=8/682 confd#=1/341
2015:08:28-12:33:30 myutm middleware[4160]: T main::top-level:264() => ending cycle 1480, caught 4 signals, 1 children still running
2015:08:28-12:33:30 myutm middleware[4160]: T main::top-level:213() => starting cycle 1481, caught 4 signals
2015:08:28-12:33:30 myutm middleware[4160]: T core::Config::Changed:194() => configversion=1446
2015:08:28-12:33:30 myutm middleware[4160]: T core::Config::Changed:204() => nodes=0 objects=4 triggers=0
2015:08:28-12:33:30 myutm middleware[4160]: T core::Config::load:347() => modules=16,53
2015:08:28-12:33:31 myutm middleware[4160]: T modules::up2date::load:108() => amazon_deployment_type=
2015:08:28-12:33:31 myutm middleware[4160]: [WARN-033] Internet uplink is up again


/var/log/confd.log:
2015:08:28-12:33:04 myutm confd[7023]: I main::top-level:677() => id="310a" severity="info" sys="System" sub="confd" name="object changed" class="interface" type="ethernet" ref="REF_IntEthExternaWan" objname="External (WAN)" user="system" srcip="127.0.0.1" sid="RKCXbaOgWLXttTikFuum" facility="system" client="service_monitor" pid="15213" attr_link="0" oldattr_link="1"


/var/log/mdw-debug.log
2015:08:28-12:33:05 myutm middleware[4160]: [WARN-032] Internet uplink is down
2015:08:28-12:33:05 myutm middleware[4160]: D utils::Exec::System:121() => /sbin/lsmod
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => service_monitor.obj (interfaces.obj,uplink->condition.conf,uplink->
primary.conf)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(loadbalance)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => packetfilter.adapter.obj (interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::ConfdCall:532() => get_objects_using_object(REF_PacPac16553FromAny2)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::ConfdCall:532() => get_objects_using_object(REF_PacPac16553FromAny3)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::ConfdCall:532() => get_objects_using_object(REF_PacPac16553FromAny4)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::ConfdCall:532() => get_objects_using_object(REF_PacPacSshFromAnyTo)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => spoofing_protection.adapter.obj (interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => afc.adapter.obj (ipsec.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => qos.adapter.obj (qos.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => dhcp_client.adapter.obj (interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => dhcp_server.adapter.obj (dhcp_server.obj,interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => dhcp_relay.adapter.obj (interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => http.adapter.obj (http.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D utils::Exec::System:121() => /sbin/lsmod
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => uplink.adapter.obj (uplink.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => icmp.adapter.obj (interfaces.obj,uplink->condition.conf,uplink->pri
mary.conf)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => icmp6.adapter.obj (dhcp_server.obj,interfaces.obj,uplink->condition
.conf,uplink->primary.conf)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => ipsec.adapter.obj (ipsec.obj,bridging.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D utils::Exec::System:121() => /sbin/lsmod
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => nat.adapter.obj (masq->rules.conf)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => pptp.adapter.obj (pptp.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => pptpc.adapter.obj (interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => ipv6_six2four.adapter.obj (ipv6_six2four.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => up2date.adapter.obj (up2date.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => ips.adapter.obj (interfaces.obj,http.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(ips)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(WirelessSecurity)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(throttle_ips)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => dyndns.adapter.obj (dyndns.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => policyrouting.adapter.obj (policy_routes.obj,interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => dynamic_routing.adapter.obj (dynamic_routing.obj,interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => psd.adapter.obj (interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => generic_proxy.adapter.obj (interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(generic_proxy)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => geoip.adapter.obj (up2date.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => service_monitor.adapter.obj (uplink->condition.conf,uplink->primary
.conf)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => pppoe.adapter.obj (interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => xorp.adapter.obj (xorp.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => tproxy.adapter.obj (bridging.obj,http.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => bridge.adapter.obj (bridging.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => clientless_vpn.adapter.obj (ipsec.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D core::Config::load:355() => interfaces.adapter.obj (interfaces.obj)
2015:08:28-12:33:05 myutm middleware[4160]: D utils::Exec::SystemCall:99() => /usr/local/bin/ct -D -p udp --state NOT_SEEN_REPLY
2015:08:28-12:33:30 myutm middleware[4160]: D utils::Exec::ForkingSystem:173() => CHILD 1 FORK 15332 /usr/local/bin/ipt_clear_confirmed.sh
2015:08:28-12:33:30 myutm middleware[4160]: T modules::ipset:[:D]eleteUnused:320() => auto#=8/682 confd#=1/341
2015:08:28-12:33:30 myutm middleware[4160]: T main::top-level:264() => ending cycle 1480, caught 4 signals, 1 children still running
2015:08:28-12:33:30 myutm middleware[4160]: T main::top-level:213() => starting cycle 1481, caught 4 signals
2015:08:28-12:33:30 myutm middleware[4160]: T core::Config::Changed:194() => configversion=1446
2015:08:28-12:33:30 myutm middleware[4160]: T core::Config::Changed:204() => nodes=0 objects=4 triggers=0
2015:08:28-12:33:30 myutm middleware[4160]: T core::Config::load:347() => modules=16,53
2015:08:28-12:33:30 myutm middleware[4160]: D core::Config::load:355() => bridging.obj (interfaces.obj)
2015:08:28-12:33:30 myutm middleware[4160]: D utils::Exec::System:121() => /usr/sbin/ebtables -t filter -L
2015:08:28-12:33:30 myutm middleware[4160]: D core::Config::load:355() => interfaces.obj (uplink->condition.conf,interfaces->interfaces.conf,
uplink->primary.conf)
2015:08:28-12:33:30 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(multipath)
2015:08:28-12:33:30 myutm middleware[4160]: D utils::Exec::System:121() => /sbin/ip link show dev eth0
2015:08:28-12:33:30 myutm middleware[4160]: D utils::Exec::System:121() => /sbin/ip link show dev eth1
2015:08:28-12:33:30 myutm middleware[4160]: D utils::Exec::System:121() => /sbin/ip -o -f inet route show table 254 exact 0.0.0.0/0
2015:08:28-12:33:30 myutm middleware[4160]: D core::Config::load:355() => networks.obj (network->dns_host->address.cobj,network->dns_host->re
solved.cobj)
2015:08:28-12:33:30 myutm middleware[4160]: D core::Config::load:355() => dynamic_routing.obj (interfaces.obj)
2015:08:28-12:33:30 myutm middleware[4160]: D core::Config::load:355() => routes.obj (interfaces.obj)
2015:08:28-12:33:30 myutm middleware[4160]: D core::Config::load:355() => policy_routes.obj (interfaces.obj)
2015:08:28-12:33:30 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(routes_policy)
2015:08:28-12:33:30 myutm middleware[4160]: D core::Config::load:355() => dns.obj (interfaces.obj)
2015:08:28-12:33:30 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(dns_route)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => user_authentication.obj (remote_access->l2tp.conf)
2015:08:28-12:33:31 myutm middleware[4160]: Local authenticated user SophosUTMSupport is disabled
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(auth_backend)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(portal)
2015:08:28-12:33:31 myutm middleware[4160]: portal enabled, allow_any on
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(ssl_vpn)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(ipsec)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(http)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(smtp_all)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => ipsec.obj (remote_access->l2tp.conf,interfaces.obj)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(roadwarrior_cisco)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => settings.obj (interfaces.obj)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => ipv6_six2four.obj (interfaces.obj)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => pptp.obj (interfaces.obj)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => http.obj (interfaces.obj)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(http_profile)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => get_static_data(ca,certdata.ph)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => get_license_info()
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => dhcp_server.obj (interfaces.obj)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => up2date.obj (http.obj)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(up2date-download)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => get_amazon_deployment_type()
2015:08:28-12:33:31 myutm middleware[4160]: T modules::up2date::load:108() => amazon_deployment_type=
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(up2date-pattern)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(clientless_vpn)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => qos.obj (qos->interfaces.conf,interfaces.obj)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(throttle_net)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(throttle_uplink)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(throttle_vpn)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(throttle_av)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => executive_report.obj (remote_access->l2tp.conf,http.obj)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::ConfdCall:532() => may(exec_report)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => dyndns.obj (interfaces.obj)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => xorp.obj (interfaces.obj)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => mobile_control.obj (remote_access->l2tp.conf)
2015:08:28-12:33:31 myutm middleware[4160]: D core::Config::load:355() => uplink.obj (dns.obj,ipsec.obj,uplink->condition.conf,uplink->primar
y.conf)
2015:08:28-12:33:31 myutm middleware[4160]: [WARN-033] Internet uplink is up again


Need more information? I will be happy to provide!

Thanks for reading,
A long-time fan of the Astaro/Sophos home license program.
(a.k.a. Bob)


This thread was automatically locked due to age.
  • Well, I tried Copernicus, but it's too far from ready for me to try and use now.

    So I went back to installing an older version of UTM 9, ssi-9.209-8.1 to be precise.
    There were 15 updates ready to install, and I'm taking my time to install each of them in order to find out when the connection start dropping.

    Right now I'm up to firmware 9.307-6 and so far the connection has not dropped once (it's running for nearly 24 hours with this firmware version).

    This tells me that my particular problem is not hardware related.
    As soon as, and if, I find out which firmware version breaks my internet connection, I will post here again.
    I've already noted all changes/fixes that are mentioned in the patch notes, so it might be easier to figure out what causes my connection to drop. That is, again, if the problem actually returns...

    PS: I've taken my time testing an unaltered /etc/asg file (because of home license on appliance) and replacing the non-Astaro recognized RAM (ssi doesn't install with this RAM installed) and neither seem to be the problem. I know, it was far fetched anyway, but since these changes are not standard, I did want to rule them out.
  • I wonder if one of the Up2Dates broke your configuration.  When this happens again, try restoring the 'Automatic backup' made prior to the Up2Date that breaks things.

    Cheers - Bob
     
    Sophos UTM Community Moderator
    Sophos Certified Architect - UTM
    Sophos Certified Engineer - XG
    Gold Solution Partner since 2005
    MediaSoft, Inc. USA
  • Well, I give up.

    It was running fine for 2 days, until the disconnects came back again.
    I decided to start from the old version again, gradually install patches and configure things the way I want to.
    At some point the disconnects came back, but even reverting to a previous backup did not fix anything.
    So right now I'm at a loss, it might still be hardware related, but I have no way to be sure.

    I was running with base functionality (no Home license installed) and with the original 2GB RAM.

    I guess I'll wait until Copernicus is in a release candidate state and see if that works for me. If this problem still persists, then I'm pretty sure I bought faulty hardware.
    If that's the case, people of Sophos, would you mind replacing my appliance with a complimentary newer version? [;)]
  • Well, I give up.

    It was running fine for 2 days, until the disconnects came back again.
    I decided to start from the old version again, gradually install patches and configure things the way I want to.
    At some point the disconnects came back, but even reverting to a previous backup did not fix anything.
    So right now I'm at a loss, it might still be hardware related, but I have no way to be sure.

    I was running with base functionality (no Home license installed) and with the original 2GB RAM.

    I guess I'll wait until Copernicus is in a release candidate state and see if that works for me. If this problem still persists, then I'm pretty sure I bought faulty hardware.
    If that's the case, people of Sophos, would you mind replacing my appliance with a complimentary newer version? [;)]


    part of the issue i think is 2 gigs of ram.  Also try the older utm version you can get that is still 9.x branch.  this is going tob e a long term thing.  try running that oldest version for a week...then if no issues the next version for another week...and so on.  if you still have this issue then you must have faulty hardware.  If you didn't purchase the hardware form a official reseller you aren't going to be able to get support from Sophos directly unfortunately.  Also home licenses give no official support either...

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • The oldest I can find is v9.113, I guess I will try that one as a last chance (I was running ssi-9.209-8.1 for a little while, it didn't seem to have this problem).
    A problem with the older versions could be the vulnerable openssl version I think.

    I know 2GB of RAM isn't much, that's why I'm replacing that with my own 4GB of similar DDR3 RAM after installation (the disconnects occur with this RAM as well) [:)]

    I appreciate the help!
  • This old version 9.113-1 has been running for a day and I've seen multiple "Internet uplink is down" messages in the Middleware logs.
    I guess that previous attempts, with patches installed, that lasted longer without interruptions were just anomalies [:(]
  • Are you actually loosing service?

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • Yes, I kept a constant ping going to 8.8.8.8 and it was timing out every time the logs told me that the internet uplink was down.
  • I just had a strange occurance.
    While I was connected to the SSL VPN of my office, the connection dropped once again.
    Even though I could not ping 8.8.8.8, my VPN session did not appear to be interrupted, everything on my remote desktop was still available and responsive.
    How is that possible? Could only certain services be unavailable?
  • I've been running Copernicus for the last couple of days, seemingly without any problems.
    Until today, suddenly I've had 3 connection drops in the last 2½ hours.

    This time though, the logs told me that Interface Port1 was Down during these disconnected periods.
    Interface Port1 is the LAN side. Previously I tried using another port as the WAN port, but I did not try changing the LAN port.
    So, I connected the LAN cable to Port5 in the firewall after configuring it, let's see if the problem still persists.