Guest User!

You are not Sophos Staff.

[9.194-5][BUG]Intel NIC crashes under load

This possibly a duplicate report.
I have been trying to do some performance reporting using two different sets of hardware built with the latest ISO.

One the NIC goes off line under load, kernel log shows a problem. BarryG advises there is an issue with the current driver.

I would provide the log entries, but that period of testing in now full of *, wrong UTM. Will need to bring the other UTM up to extract the log entries.

I changed the the NIC for another of the same type and model and got the same results. 

Ian


2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536] e1000e 0000:00:19.0 eth0: Detected Hardware Unit Hang:
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536]   TDH                  
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536]   TDT                  
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536]   next_to_use          
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536]   next_to_clean        
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536] buffer_info[next_to_clean]:
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536]   time_stamp           
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536]   next_to_watch        
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536]   jiffies              
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536]   next_to_watch.status 
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536] MAC Status             
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536] PHY Status             
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536] PHY 1000BASE-T Status  
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536] PHY Extended Status    
2014:02:08-14:37:56 Cats-speed kernel: [ 2178.936536] PCI Status             
2014:02:08-14:37:57 Cats-speed kernel: [ 2179.944779] e1000e 0000:00:19.0 eth0: Reset adapter unexpectedly
2014:02:08-14:38:00 Cats-speed kernel: [ 2183.235199] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx

Parents Reply Children
  • Guys, small question.

    So far the adapters under question are:
    -Intel 82572EI NIC (barry)
    -Intel Corporation 82579LM Gigabit Network Connection (martin)
    -Intel Ethernet Connection I217-V (ian)

    Did u have this problem in 9.1? Thanks,
    Bianca


    Short answer -> NO. The adapter reset was introduced in this beta [8-)]

    // Martin
  • Guys, small question.

    So far the adapters under question are:
    -Intel 82572EI NIC (barry)
    -Intel Corporation 82579LM Gigabit Network Connection (martin)
    -Intel Ethernet Connection I217-V (ian)

    Did u have this problem in 9.1? Thanks,
    Bianca


    Hi, this is new hardware for me, and I never installed another version on it.

    However, BruceKConvergent seems to be having a similar problem in 9.1; did you see his posts?

    Barry
  • Hi Bianca,
    that report I submitted might not reflect what was happening at the time of the errors. I changed NICs and the order was changed, caused large quantities of grief. I was lazy and did a rebuild.

    I will try load test tomorrow night when I get home if not too late.

    Ian
  • Hi, this is new hardware for me, and I never installed another version on it.

    However, BruceKConvergent seems to be having a similar problem in 9.1; did you see his posts?

    Barry


    The kernel / NIC driver patch they put out in 9.108 fixed the issue I was having in 9.10x.

    CTO, Convergent Information Security Solutions, LLC

    https://www.convergesecurity.com

    Advice given as posted on this forum does not construe a support relationship or other relationship with Convergent Information Security Solutions, LLC or its subsidiaries.  Use the advice given at your own risk.

  • Guys, small question.

    So far the adapters under question are:
    -Intel 82572EI NIC (barry)
    -Intel Corporation 82579LM Gigabit Network Connection (martin)
    -Intel Ethernet Connection I217-V (ian)

    Did u have this problem in 9.1? Thanks,
    Bianca


    We are running 9.108-23 on a ASG120 (Intel 82583V), facing the same problem. Not much load on this Interface (100 Mbit max)

    e1000e 0000:04:00.0 eth1: Detected Hardware Unit Hang:
    
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811]   TDH                  
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811]   TDT                  
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811]   next_to_use          
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811]   next_to_clean        
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811] buffer_info[next_to_clean]:
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811]   time_stamp           
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811]   next_to_watch        
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811]   jiffies              
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811]   next_to_watch.status 
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811] MAC Status             
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811] PHY Status             
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811] PHY 1000BASE-T Status  
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811] PHY Extended Status    
    2014:02:15-14:00:41 ruhraue-1 kernel: [315204.820811] PCI Status             
  • Hi folks,
    tonight I tried to load the box up with iperf, a failure. Maximum throughput I could get was 800kb/s that was with most functions disabled. The i-217v NIC after being changed from PPPoE to static IP never showed the link as being up. 

    Not sure which box was not being friendly, that will be a series of tests for another day. Last series was using to Dell laptops, this time is was one Dell and a MAC.

    Ian
  • We are running 9.108-23 on a ASG120 (Intel 82583V), facing the same problem. Not much load on this Interface (100 Mbit max) 


    Hi pedata,

    In 9.108, this should have been fixed for Intel 82546GB and Intel 82583V. There are several scripts which are running for these adapters. You can check in /etc/udev/rules.d/20-nic.rules

    If issue persists, please contact customer support and refer the mantis id 27887.

    Thanks. Best,
    Bianca
  • Some other info that might help the devs with this... check the device attributes of the affected NIC(s) ... from root console, run lspci -nn ... this will list the device name, the vendor id (intel is 8086), then the device Id .. for instance the 82583V NICs in one box I use has the device ID of 0x150c ...

    Maybe your hardware has different IDs than what Sophos is looking for -- their fixes via UDEV are all about turning off TSO on the NIC, and it's based on identifying the device by the device attribute.  For the 82583V, they are also disabling  a power management function as well (it's in /etc/udev/rules.d/20-pci.rules).

    The IDs they are turning off TSO for are 0x1079, 0x107b, and 0x150c.  The ID they are turning off a PCI Power Management feature for is 0x150c .

    Just throwing that out there.

    CTO, Convergent Information Security Solutions, LLC

    https://www.convergesecurity.com

    Advice given as posted on this forum does not construe a support relationship or other relationship with Convergent Information Security Solutions, LLC or its subsidiaries.  Use the advice given at your own risk.

  • Well, my nic looks like this:
    02:00.0 Ethernet controller [0200]: Intel Corporation 82572EI Gigabit Ethernet Controller (Copper) [8086:10b9] (rev 06)

    so that ID should be in there too
  • One thing i did forget to add to my last report and that is the when setup for ADSL I get a throughput of approx 3.8mb/s max line speed.

    So, one device wasn't playing nice.

    Ian
Share Feedback
×

Submitted a Tech Support Case lately from the Support Portal?