Guest User!

You are not Sophos Staff.

[9.091][BUG] Extremely sluggish system performance after Up2date

Hi there,

after the up2date my IPS went crazy (see other thread). But even worse, the whole system is reacting unbelievable slowly.

After the reboot it took a multiple of the usual time until answering pings again. Opening WebAdmin took ages and required to ignore the 30 second timeout multiple times.

When I finally got into WebAdmin I saw it was showing CPU usage at 100%. I rechecked that with top (see screenshot). As you can see there, the system is in fact doing almost nothing but "waiting" for something I cannot think of [;)]


System load is correspondingly bad, too.

I will switch back to 9.090 for now. The new 9.091 version is unusable for me at this time.

Best regards,
Bastian
  • How many snort instances do you run? Mine seems to be running ok without any problem but I usually stop http proxy and snort before I apply a firmware patch [:$]
    Regards
    Bill
  • At the time of this screenshot IPS was already disabled (I needed to stop the mail flood [;)]).

    Edit: the VM has two virtual CPUs, and the 64-bit kernel was used, if this information is useful in this thread
  • up the ram to 4 gigs monarch that is the realistic minimum for utm 9.  Been that way since v 9 first came out.

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • I may cite the release notes:
    While
    using 1GB of memory is possible, 2GB is heavily recommended for UTM 9.


    I'm running with 2 GB of RAM since the 9.1 Beta. And with 1,5 GB with Version 9.0.

    For the three or four clients I have at home this was always fast enough and no problem. Of course it made use from the swapfile, but this what it's designed for and what I can live with very well. It handled my 50 Mbps internet line without any issues.

    Why should the 9.091 update need more RAM? In my screenshot you can see less than 1 GB of RAM was being used and it still was extremely slow.

    The problem has to lay somewhere else.
  • you need to search the forums..i don't care what the press release days..actually 4 gigs has been the realistic minimum since 8.5 if you did anything more than 1-2 users and/or you ran ips AND http proxies.  The main reason for this is partly because of memory leaks..which are finally being addressed..the other is the enormous featureset of the product itself.  There's no getting around the fact the utm codebase simply requires quite a bit of ram to operate.  Properly tuned Linux boxes should swap less than 10% max..preferably not at all.  MOre features=larger codebase which no matter how good the code=more ram usage.  sophos needs to make their minimum 4 gigs with reccomendations for 8 just to start.  Look at your own machines performance..search the forums for my warning about this over a year ago..and search the forums for others ram usage....it's a reality sophos is having to face.

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • This may all be true, and I would not use Astaro at my business with 2 GB of RAM. At home my server has more than enough I/O performance for what it is doing so the swapping doesn't matter to me at all. And it's clear that in general less swap usage is better than more swap usage. But all that has nothing to do with the topic of this thread. 

    My machine was not actively swapping when I had the performance problem after the last Up2date. I can see the activity of the system as well as from inside (top) and from outside (Hyper-V console/Windows resource monitor) and can easily eliminate memory shortage or swapping as the cause for the problem here. My machine didn't suffer from memory shortage, the top screenshot is clearly showing this.
  • with that much i/o wait i bet you were creaming the disk..the amount of total swap may not have gone up but the disk was getting hammered...did you reboot after the upgrade?

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • OK, let me beginn from the start.

    After reinstalling and restoring my configuration into 9.090 yesterday, I now gave 9.091 another try. Before that I took a snapshot from the VM in case the update would render my VM unusable again [;)]

    After the Up2date I got more or less the same result as yesterday. Different only that even WebAdmin or SSH weren't accessible this time, too. So I logged into my VM via console.

    As you requested first thing I did was rebooting the VM. I should note that the VM came to a full freeze at "Unmounting file systems", so I had to reset it forcibly.

    After the next boot nothing has changed, WebAdmin/SSH still inaccessible. I again made a top screenshot. A few seconds later I captured the resource monitor from the Hyper-V host. As you can see, on the whole host was effectively no CPU or I/O load (the RAID on that host can easily handle 200 MB/s, but here there wasn't more than some 100 kB/s from time to time (probably produced by the other VMs running...).

    I suspect the latest kernel update to have some defect in its Hyper-V drivers or something in that direction.

    Conclusion: 9.090 snapshot restored.
  • sounds like it..[:)]

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • ...I suspect the latest kernel update to have some defect in its Hyper-V drivers or something in that direction...
    I was surprised that they were still upgrading the kernels too. I guess they want to run the latest stable so 3.8.7 should be here next update[:O]