Guest User!

You are not Sophos Staff.

[9.070][BUG] UTM unusable if external interface fails

If for any reason your external interface fails eg modem fails, ISP takes your link down etc the UTM will not respond to the internal interface. All connections to the UTM including APs drop, no connection until a stable external interface is restored.
I have been trying to replace a faulty modem, but the replacement modem doesn't go into bridge mode easily. I have not been able to connect to the UTM to review logs, not good.

The UTM has two interfaces internal and external both Intel NICs.

Ian
  • Hi Ian,

    below i have gathered some questions in reply to your post. Furthermore i would like you to provide even more informations.
    This would help us to track things better down. Your logfiles have been very helpful!

    Could you please provide a backup of the affected configuration, there is an option to remove "uniq site data" from the backup? You could send it by mail
    if you concerned about privacy. 
    afschin.hormozdiary@sophos.com
    otherwise let me know which services are enabled and configured on the box.
    As far as i can see, ipv6, some qos or traffic shaping are enabled.

    Furthermore i would like you to really ensure that the problem still occurs with the following two setups:
     1. establishing pppoe connection while ipv6 is disabled (and reconnect/interruption) occurs on the ppp interface
     2. ipv6 disabled while pppoe establishment and switching it on afterwards

    Do you have any QOS enabled on the ppp interface?
    Do you have setup HA?


    broke the link tonight to collect the logs you requested.

    just to be sure. By "broke the link" you mean plugging off the modem-cable?


    I hope the attached collection helps resolve this issue because it takes the UTM about 5 minutes to settle down after a link loss. 

    Does this mean connectivity is coming back after approx minutes and you cannot even access the UTM during this time period?


    And just to make sure, I can't login to the box to see what is happening. The current box that has failed, has 4 ethernet ports (all Intel) and vlans.

    What happens with e.g. ssh connections which are already established before the "box fails"? Is that connection still working then?

    Best regards
    Afschin
  • Thanks for reporting. We are now tracking this as Mantis ID #24418
  • I can respond about IPv6
    In my system is DISABLED
    No QoS
    WAN ip is static provided by ISP account, checked or not checked "Static" in WAN Interface the problem persist
  • Olsi, do you have Anti-port scan enabled?
  • Was able to reproduce the issue using PPPoE with IPv4:
    - enable Anti-Portscan
    - break PPPoE connection
    - Middleware is dying due to psd.pm:

    2013:03:06-14:56:51 qa-220-e1-1 middleware[3829]: >=========================================================================
    2013:03:06-14:56:51 qa-220-e1-1 middleware[3829]: E Can't locate object method "Source" via package "inet" (perhaps you forgot to load "inet"?) at /modules/IPTables/Adapter.pm line 129.
    2013:03:06-14:56:51 qa-220-e1-1 middleware[3829]: 
    2013:03:06-14:56:51 qa-220-e1-1 middleware[3829]: 1. main::_warn:180() mdw.pl
    2013:03:06-14:56:51 qa-220-e1-1 middleware[3829]: 2. main::_die:177() mdw.pl
    2013:03:06-14:56:51 qa-220-e1-1 middleware[3829]: 3. modules::IPTables::Adapter::addRule:129() /modules/IPTables/Adapter.pm
    2013:03:06-14:56:51 qa-220-e1-1 middleware[3829]: 4. modules::IPTables::Adapters:[:P]sd::addPsdRules:48() /modules/IPTables/Adapters/psd.pm
    2013:03:06-14:56:51 qa-220-e1-1 middleware[3829]: 5. modules::IPTables::Adapters:[:P]sd::generateRules:160() /modules/IPTables/Adapters/psd.pm
    2013:03:06-14:56:51 qa-220-e1-1 middleware[3829]: 6. modules::IPTables::Adapter::load:60() /modules/IPTables/Adapter.pm
    2013:03:06-14:56:51 qa-220-e1-1 middleware[3829]: 7. core::Config::load:279() /core/Config.pm
    2013:03:06-14:56:51 qa-220-e1-1 middleware[3829]: 8. main::top-level:222() mdw.pl


    - the rules in iptabels seem to dissapear and ping towards internet fails (even thought PPPoE connection is up and running).

    Guys could you please try and see if this happens without antiport scan enabled?
    Regards
  • Hi folks,
    I have 2 UTMs which suffer this complaint.
    1/. one is using PPPoE with native IPv6 support
    2/. the other is using IPv6 over a sixxs tunnel.

    I tried the test with IPS disabled, not quite as bad, but the wifi fails so I loose connection to the UTM. I will try again tonight after work with an ethernet connection.

    I will e-mail you the config when the mail system delivers it. I have another issue there, the UTM mail system seems to have developed a strange time format 1920am on mail messages.

    Ian
  • The Mantis ID #24418 is now being worked on. We are planning to release a fix for this issue in Version 9.080.
  • Just Updated to  9.075-8
    the prob persist
    Notifications by email in receive order:
    Application Control daemon not running - restarted
    Middleware not running - restarted (after WAN reconnect test)
    System was restarted
    New Firmware Up2Date installed