This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

bbc & google uncategorized - trusted source issues?

Yesterday we saw between 09:30-10:00 GMT & 17:30-18:00 sites such as google and bbc were not categorized by astaro. Was there an issue with trusted source / astaro web content cache servers at this time?

These sites were categorized correctly during the rest of the day.


Has anyone else seen this? [:S] [:S] [:S]

eg:

2008:10:30-09:29:18 (none) httpproxy[3964]: id="0060" severity="info" sys="SecureWeb" sub="http" name="web request blocked, forbidden category detected" action="block" method="GET" srcip="x.x.x.x" user="uuuuu" statuscode="403" cached="0" profile="profile_0" filteraction="action_REF_RRRRRR" size="2650" time="52 ms" request="0xa6d43b48" url="news.bbc.co.uk/" error="" reason="category" category="9998" categoryname="Uncategorized"

2008:10:30-09:34:17 (none) httpproxy[3964]: id="0060" severity="info" sys="SecureWeb" sub="http" name="web request blocked, forbidden category detected" action="block" method="GET" srcip="x.x.x.x" user="uuuuu" statuscode="403" cached="0" profile="profile_0" filteraction="action_REF_RRRRRRR" size="2654" time="1 ms" request="0xaf58bb18" url="www.google.co.uk/" error="" reason="category" category="9998" categoryname="Uncategorized"


This thread was automatically locked due to age.
Parents
  • We have seen the issue again at around 14:43 6/11/2008 GMT, it seems that sites that should be categorized, eg google are not for a short period of time, must be an issue with Astaro servers and/or trusted source?

    Can someone that has a few minutes to spare, pls chek their http.log around the time I have posted, to see if they see similar?

    eg:

     grep 9998 /var/log/http.log | grep google

    2008:11:06-14:43:15 (none) httpproxy[3964]: id="0060" severity="info" sys="SecureWeb" sub="http" name="web request blocked, forbidden category detected" action="block" method="GET" srcip="x.x.x.x" user="RRRRRR" statuscode="403" cached="0" profile="profile_0" filteraction="action_REF_RRRRRRR" size="2646" time="59 ms" request="0x8295590" url="google.co.uk" error="" reason="category" category="[SIZE="5"]9998[/SIZE]" categoryname="[SIZE="5"]Uncategorized[/SIZE]"
  • I decided to tick the box named "block uncategorized" websites and created a nightmare.

    I have now unticked it again to stop people pestering me to unlock genuine websites.

    Is there a problem with the TrustedSource Categorization engine?

    Help!
  • I'm not blocking "Uncatgorized", because I think it's a bad idea, normally.
    But I've checked our logs for today, and I didn't see any wellknown sites marked as "Uncategorized".
  • I'm not blocking "Uncatgorized", because I think it's a bad idea, normally.


    Thanks for checking. Can you explain a little why you think its a bad idea?

    My thoughts are new sites that may have dubious/non-business/etc content would probably be 'uncategorized', where as well known established sites should be 'categorized' by trusted source.

    The astaro is working 99% of time, its just for 5-10 minutes most days at random times it 'forgets' its categories for well known sites such as google, bbc, etc. It resumes normal operation after a short while.

    Anyone else manage to try the grep in my previous post on http.log for 6/11/08 ?
Reply
  • I'm not blocking "Uncatgorized", because I think it's a bad idea, normally.


    Thanks for checking. Can you explain a little why you think its a bad idea?

    My thoughts are new sites that may have dubious/non-business/etc content would probably be 'uncategorized', where as well known established sites should be 'categorized' by trusted source.

    The astaro is working 99% of time, its just for 5-10 minutes most days at random times it 'forgets' its categories for well known sites such as google, bbc, etc. It resumes normal operation after a short while.

    Anyone else manage to try the grep in my previous post on http.log for 6/11/08 ?
Children
  • Well, when I grep our content-filter-log and look for categoryname="Uncategorized", I find lots of legit sites,which are uncategorized. Phones wouldn't stop ringing if I blocked uncategorized. There are way too many websites in the world. No company could categorize them all.