This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

[9.200] high httpproxy cpu usage

Since the update to 9.200, I've seen httpproxy causing 100% cpu usage a few times a day, the proxy becomes unresponsive (webadmin, etc seem to be still OK, though). Restarting just the proxy alleviates the problem, plus I've seen it restart on its own if left long enough. 

 
Normally, httpproxy only consumes between 50 and 150% CPU on 4 cores. I'm Running the software version on VMWare.

Any thoughts?


This thread was automatically locked due to age.
Parents
  • That message occurs when you have inefficient RegEx and a very long URL.  It is not an error per se and can be ignored.

    In that thread/mantis we updated some RegEx that we wrote, however any RegEx that are customer written need to be updated by customers.

    You have an Exception called "Advanced Academics".  The regex probably looks something like:
    ^https?://(.*\.)?site\.com/

    You should change it to
    ^https?://([A-Za-z0-9.-]*\.)?site\.com/

    The difference is that .* will match any character and therefore the entire long URL is checked for site.com.  The character group [A-Za-z0-9.-]* does not match a / therefore the site.com will only match if it occurs before the first slash - in other words it searches the domain only.

    Also try this tool:
    Quick RegEx for URLs | UTM Tools

  • You have an Exception called "Advanced Academics".  The regex probably looks something like:
    ^https?://(.*\.)?site\.com/

    You should change it to
    ^https?://([A-Za-z0-9.-]*\.)?site\.com/


    Indeed, they are like that. Thanks for the explanation. I guess I didn't think searching the whole URL was an issue, but I see how it could be. Does the "." in [A-Za-z0-9.-] become literal (instead of matching any character) when it's inside the brackets?
Reply

  • You have an Exception called "Advanced Academics".  The regex probably looks something like:
    ^https?://(.*\.)?site\.com/

    You should change it to
    ^https?://([A-Za-z0-9.-]*\.)?site\.com/


    Indeed, they are like that. Thanks for the explanation. I guess I didn't think searching the whole URL was an issue, but I see how it could be. Does the "." in [A-Za-z0-9.-] become literal (instead of matching any character) when it's inside the brackets?
Children
No Data