Guest User!

You are not Sophos Staff.

[7.386] New load balancer doesn't work well

I'm trying out the new Load Balancer under NetworkSecurity...

I can't get it to work well... I've setup one recently on our 7.305 and it worked, and I'm familiar with other LB's, so I _think_ I know what I'm doing...

On 7.386, I've defined a host definition for one of Google's IPs (74.125.95.104), and one of Yahoo's (209.131.36.158).

I've setup a load balancer for it, on the DMZ interface address of my firewall (10.0.0.254), service HTTP.
Check Type: http host
Check URL: /

It shows both hosts are UP on the load balancer status.

When I go to http://10.0.0.254/, it ALWAYS gets google. (using shift-reload in browser)

If I change the IP of the Google definition to 10.0.0.10, which is offline, the status then says 'DOWN' for google, BUT http://10.0.0.254/ ALWAYS FAILS!

Am I doing something wrong, or is something broken/not fully implemented yet?

Thanks,
Barry
  • No, should there be any?

    BTW: You could either disable persistence or change the persistence time with the command
    line tool confd-client.plx


    Earlier you said


    * Users stick for one hour to a real server. However if this real server is down,
    the balancing decision and persistence is generated again.


    But last I tested, users were getting stuck to servers even when webmin showed they were down.
    I'll try to test it again today.

    Thanks,
    Barry
  • Testing with 7.390 now, this time internally

    Service: HTTP
    Virtual Server: Astaro Internal Address
    Servers: Laptop1, Laptop2
    Check Type: HTTP host, index.php, 15

    Astaro correctly sees whether the laptop servers are up or down, but it still is 'sticking' clients to servers even if the server goes down (and Astaro sees it's down).

    Can someone explain which commands or variables are used in confd-client.plx for the lb?

    Also, I notice that the laptops cannot use the loadbalancer to get to themselves. I don't know if this is an anti-spoofing feature or a bug.

    Thanks,
    Barry
  • My 2 windows PC's can hit the loadbalancer (still with same problem as above), but my linux pc cannot. All 3 are on the same VLAN, and the lb machines are on the WiFi VLAN.
    The linux PC can get to the end user portal on the same IP as the virtual LB.

    Barry
  • Since the last post from almost 2 hours ago, I went out to dinner, and now I'm back.

    Now, Astaro still (correctly) shows laptop1 is down and 2 is up.

    Now, the linux PC can hit the lb successfully (routed to the server which is up), but neither windows pc can.

    I'll fire up some sniffers, but the likely explanation is that the lb is badly broken.

    Barry
  • After 1 more hour (almost 3 hours now), Astaro finally seems to have done something about laptop1 being down, and all 3 clients are getting sent to laptop2. 

    So, lets bring laptop1 back up, and kill laptop2.
    Webmin correctly shows the status, but clients are still 'stuck' to laptop2.

    Sniffing the traffic confirms this.

    Thanks,
    Barry