This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Traffic Stops Forwarding on eth0 (Internal)

I wanted to see if anyone else is running into the same issue I have been experiencing.  One of my three UTM 120's (the most utilized one) has gone through two instances in the last week where it stops forwarding traffic on the internal eth0 interface.  My outside monitoring shows that that the external interface stays up and our Site-to-Site VPN tunnels remain established.  Since this has occurred right in the middle of our core business hours I haven't had the luxury to poke around determine a fix or cause and just had to go straight to the nuclear reboot option.

We have premium support so Sophos reps have accessed the device and checked the logs but haven't really come up with anything.  The first instance occurred the day 9.206 was released so at the time we were still on 9.205 and the recommended action was to upgrade.  The second occurrence of this issue was a few days after upgrading to 9.206.

I am curious if anyone else here has been running into a similar issue, if so have you found either a temporary or permanent fix for the problem.


This thread was automatically locked due to age.
  • Hi, Jamie, and welcome to the User BB!

    What do you mean by "it stops forwarding traffic on the internal eth0 interface" - what do you see that leads you to that conclusion?

    At the time of the stoppage, is there anything interesting in the logs mentioned in #1 in Rulz?

    Cheers - Bob
  • What we are seeing is 100% packet loss for everything on the internal interface.  As in all traffic between internal network segments is dropped, the internal interface stops responding to pings, all traffic from Internal -> External is dropped, all traffic from outside of the network being forwarded to services in side is dropped and while the VPN tunnels stay established users on the other end are unable to reach systems on the side that is down.

    Looking at the Kernel and System logs Neither Sophos support nor I have found anything obvious. FYI, we have IPS off and our firewall policy is very basic.
  • When the stoppage occurs, have you looked at your switch to see if there's an Ethernet storm in your network?  This sounds suspiciously like situations I've seen where someone brought in their own wireless router and managed to create a loop.

    In the meantime, do take a look at the logs in #1 in Rulz.  When you say that "traffic is dropped," do you mean you see drops in the Firewall Log file?  The Intrusion Prevention log contains more than just IPS activity - did you look at it?

    Cheers - Bob
  • We had checked other logs, IPS was empty and Firewall logs showed nothing around the time of incident.

    There was another occurrence last night and this time we captured the following several times in the Kernel logs:

    kernel: [129848.833045] e1000e 0000:05:00.0 eth0: Reset adapter unexpectedly
    kernel: [129852.121290] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
    kernel: [129854.825197] e1000e 0000:05:00.0 eth0: Detected Hardware Unit Hang:
    kernel: [129854.825197]   TDH                  
    kernel: [129854.825197]   TDT                  
    kernel: [129854.825197]   next_to_use          
    kernel: [129854.825197]   next_to_clean        
    kernel: [129854.825197] buffer_info[next_to_clean]:
    kernel: [129854.825197]   time_stamp           
    kernel: [129854.825197]   next_to_watch        
    kernel: [129854.825197]   jiffies              
    kernel: [129854.825197]   next_to_watch.status 
    kernel: [129854.825197] MAC Status             
    kernel: [129854.825197] PHY Status             
    kernel: [129854.825197] PHY 1000BASE-T Status  
    kernel: [129854.825197] PHY Extended Status    
    kernel: [129854.825197] PCI Status             
  • Aha... This is an issue that was supposed to already be fixed... I'd forward that log entry to support ASAP.  The nic driver is crashing.
  • Received word that the issue with Intel network cards hanging occasionally is being looked at by development and is issue number #32902