This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

HA Evaluation/Notes & Ethernet + Serial link status (or lack thereof)

My company is evaluating ASL HA for use to learn the ins and outs of the current functionality before putting it into production.

Some notes we had with #1 and #2 being a significant disappointment for us:

1. If you are using Serial + Ethernet for HA, if one is disconnected you don't get any notification of it until the other connection goes down. Which basically defeats the purpose of using both Serial + Ethernet since you won't know about the failure until the other one fails and then you end up with both instances running at the same time. Anyone else see this as a problem?

We opened a ticket with Astaro who basically danced around the issue and said HA is being revamped for V7. Unfortunately, this still leaves us with a less than optimal siutation until possibly V7 is released and then who knows if V7 will even address the issue? (See these 2 threads for 2 outstanding issues we have handled the same way: #1 #2)

2. HA transfer is very very slow. It takes 25-45 seconds to perform a failover even for a planned outage like an up2date, so I'd hardly call it HA if you are looking for good uptime even for planned updates and reboots. More like warm standby. Each update which requires a reboot requires 2 reboots (update master, failover to slave for master reboot, failover to upgraded master after reboot) so that means you get 40-90 seconds of downtime even with HA.

3. NIC link failures which trigger a failover result in the master being shutdown. Unexpected, but OK.

4. There's no way to manually failover to a "preferred" HA instance short of rebooting the current master or pulling a cable if it isn't the one you want to be running. Would be nice to have a button to manually trigger a failover.

5. Any changes to the HA configuration need to be followed by a system reboot.

I think that's it for now. Hope this helps anyone who is thinking about trying an Astaro HA setup.


This thread was automatically locked due to age.
Parents
  • Hi Drees,

    I have that same dilemma when evaluating a replacement firewall for our company. Before you have any slight intention to throw ASL out of the equation, please consider this.

    1. Astaro with HA works exactly as what it designed for - High Availability. You have two boxes, one running live and the other one running hot standby. In normal incident, the live unit would fail and the slave should kick in almost instantly. From your remark, I understand that most management wants more than a master/slave standby kind of hardware. It would seem that what you want is more like a load-balancing kind of solution instead. Secondly, you should know exactly when your box failover or such – enter your email address under System >> Settings – Administrator Contact. You will receive immediate email notifications for any incident occurring on your Astaro box.

    2. HA failover does takes about 30 to 45 seconds depending on the type of hardware you’re running on. This is normal. One cannot expect any Linux running box to complete start-up within 5 seconds, right? Normally, you’d schedule a preventive maintenance for one hour downtime for example and that will give you more than enough time to reboot both boxes with latest up2date.

    3. Another proof that Astaro HA does works. More reason for one not to simply disconnect any cable without care. Because HA installations normally used in companies, they should prevent accidental cable removal by have secure access to the equipment itself – and remember to label the cables clearly and properly.

    4. Actually, there is. You can either restart the master unit form Webadmin, or should you use an ASG box, the front LCD display has buttons on it for manual reboot, factory reset and shutdown.

    5. That’s imminent. HA configuration should not be modified once the HA has been setup properly. One thing to note, use the next available port for HA interface to avoid problem such as frequent rebooting in the earlier up2date version.

    In the end, ask yourself this question – who else other than Astaro can provide simple, ease of use, reasonably inexpensive solution, and unified threat management system in a box?

    Ferdaus.
  • 1. Sorry, you misunderstand, I do not want a load balancing solution, I am looking for failover, master/slave with hot standby. I also expect to be notified if one of the HA links goes down for some reason! (though I do have some issues with Astaro's Load Balancer which I believe are known issues).
    2. I don't think it's unreasonable to expect a failover within 5 seconds, in fact, so does Astaro as they have told us that for V7 failover should be much faster than with previous versions.

    The other items are just part of familiarizing oneself with Astaro's HA, those were listed as they were a bit if a surprise to myself and my team doing the evaluation, so I imagine that someone interested in HA may also like to hear about it.
  • I can give some experience on HA in my two Datacenters. I have two datacenters, each one has a pair of ASG 220's in HA. Been running them for over a year now. Number of glitches, unexpected downtime events? 0.

    Yes the actual failover does take a few seconds, but it is active/passive HA, not active/active HA. 

    I work on a daily basis with a pair of Netscreen 500's i HA, in active/passive. They take about three seconds to failover. BUT, they do not have nearly the functionality ASG does.

    I have to agree, unless you have poor cable management, the box should not fail for a cable being pulled. And for the reboots from Up2Date, are you saying you only have 5 minute outage windows?

    V7 from what I understand has had MAJOR HA revamping work done. I believe it has automatic HA setup, and much faster failover. Heres to hoping the beta comes out soon so I can test it.
Reply
  • I can give some experience on HA in my two Datacenters. I have two datacenters, each one has a pair of ASG 220's in HA. Been running them for over a year now. Number of glitches, unexpected downtime events? 0.

    Yes the actual failover does take a few seconds, but it is active/passive HA, not active/active HA. 

    I work on a daily basis with a pair of Netscreen 500's i HA, in active/passive. They take about three seconds to failover. BUT, they do not have nearly the functionality ASG does.

    I have to agree, unless you have poor cable management, the box should not fail for a cable being pulled. And for the reboots from Up2Date, are you saying you only have 5 minute outage windows?

    V7 from what I understand has had MAJOR HA revamping work done. I believe it has automatic HA setup, and much faster failover. Heres to hoping the beta comes out soon so I can test it.
Children
  • Thanks for the feedback, we are looking forward to V7, we just wish Astaro would be a bit more vocal about what to expect for V7, so far just about everything is rumors.

    Again, our only real issues with Astaro HA are issues #1 and #2 in my original post. Scheduling downtime for updates isn't a deal (we are evaluating the HA for sites currently running Astaro so we already regularly schedule downtime for updates), but when the docs claim that failover is instant and instant turns out to be 20-40 seconds, I tend to be disappointed.