This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Problems with eDirectory SSO

We've had mounting problems with edirectory sso over the last few months. I would say ever since the 7.5 update which we did over Christmas break.

At first it was just a few users saying that they would get prompted for manual authentication then it slowly escalated to just about every user having experienced it at some point.

Tonight the whole thing went meltdown.

Messages in the AUA log - tons per second repeating over and over thousands of times and no one could authenticate:

[PHP]2010:04:12-20:00:32 thetube aua[30840]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30841]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30842]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30843]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30844]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30845]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30846]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30847]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30848]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30849]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30850]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30851]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30852]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30853]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
2010:04:12-20:00:32 thetube aua[30854]: id="3006" severity="info" sys="System" sub="auth" name="Trying 10.1.1.227 (edirectory)"
 [/PHP]

We rebooted and at first it seemed to work but minutes later the same symptoms appeared. I tried entering a different LDAP server and the same symptoms occurred. The LDAP servers were both responding normally to other LDAP requests from our other systems. 

I rebooted one last time with the 2nd server active and I am still getting the 'trying' message but it seems to have calmed down for now.

Its too bad because we had similar issues to these when we first started with Astaro a couple years ago and then they seemed to be fixed with 7.3 Now we're back to where we started.

Will probably open a ticket tomorrow but wanted to see if anyone had any thoughts.


This thread was automatically locked due to age.
Parents
  • Response from Astaro - hopefully this is the issue, I do have 10K SAS drives though:

    An escalation engineer and I were looking over your system.  We have found that
    the issue is likely related to high load/latency of your system.  The CPUs are
    fast enough and the memory is sufficient but your HDDs seem to have a bit of
    latency that is causing wait time and high load on the CPUs.  As a result, we have
    disabled http caching.  This helped a little bit with the CPU wait time and load
    average, but not enough to make a large difference.  We have also found that the
    log partition is over 90% full.  This is mostly (24GB) http log files from last
    year.  It is recommended to set your log file retention to delete every 90 days or
    less under logging > settings.  Then once the log rotation is kicked off at
    midnight, the system will delete all log files older than 90 days.

    Once this is done, you should see better performance of your system and hopefully
    the popups will cease.
  • Well despite all the changes on both the Astaro and the Ldap/eDir servers I still am having my original issue. Just a few minutes ago auth completely died and just spammed the aua.log with 1000's of lines of 'Trying 10.1.1.x' (edirectory)

    Changing LDAP servers did not help. 

    Rebooting the Astaro fixed the issue. I sent a log out to Astaro let's see what they say.

    My constant proxy popup have slowed slightly but despite all the changes I still have issues with auth and random users. Even though they have been browsing fine for hours, all of a sudden they will get a proxy pop up storm where if they enter credentials or click cancel it will continue to appear. They must usually reboot to fix it.
  • Submitted an AUA debug log, support basically said 'wierd' and escalated it. 12 days later, still no response.

    If anyone is interested I can post it but I'm too lazy atm to remove all the usernames and passwords [8-)]
Reply
  • Submitted an AUA debug log, support basically said 'wierd' and escalated it. 12 days later, still no response.

    If anyone is interested I can post it but I'm too lazy atm to remove all the usernames and passwords [8-)]
Children
No Data