This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Maybe faulty pattern - Do not reboot!

Hey everyone,

sorry about the double-post, but imho this important enough to be on the mainpage.

There seems to be an actual issue regarding a faulty pattern.

The information I got:
If your box is making some trouble, do not reboot.

After a reboot the hardware appliance may hang with a haldaemon-failure, without any interface showing up.....

If you ran into this issue, here the "official workaround":
(information by astaro-support)

[SIZE="2"]
please do the following steps to bring back the system:

plug a monitor and keyboard to the system

login via root on commandline

If the directories do not exist and there is no connectivity:

  mkdir /opt
  mkdir /opt/inst
  mkdir /opt/tmpfs
  mkdir /opt/tmpfs/run
  mkdir /opt/gnome
  mkdir /opt/gnome/lib
  mount /opt/inst
  rpm -Uvh glib2****** --force (aus /opt/inst)


cp /var/storage/chroot-pop3/usr/lib/libglib-2.0.so.0 /usr/lib/

cp /var/storage/chroot-pop3/usr/lib/libgobject-2.0.so.0 /usr/lib/

Afterwards list all available system backups:

backup.plx –l

choose the lastest backupfile! Excecute the following command:

backup.plx –i /var/confd/var/storage/snapshots/cfg_*****
[/SIZE]

Astaro seems to work on this issue, a "repairing pattern-update" will come soon.

Best regards,
Thomas


(my main-gateway was offline for nearly 4 hours today and had to be re-installed.......)


This thread was automatically locked due to age.
  • @CyberMuz

    Thanks a ton Brother! for all that information ! u shud be in astaro team  rather [;)]
  • As previously communicated, on Friday August 27th we released a pattern which includes a fix for the y2k38 issue for all “old” versions (ie earlier than 7.507 and 8.001).

    This fix was applied successfully by the pattern script, but the script had the unwanted side effect of removing a directory on the disk. This directory contains some temporary data used internally by the Astaro system and also, on version 7 systems, it contains a copy of some system libraries. These libraries were replaced by another pattern which was delivered approximately 2-3 hours later (depending on the version running).

    Most customers and systems should not have experienced any issue. The system was correctly patched and the y2k38 problem has be circumvented.

    However, the loss of temporary data meant that HA systems appeared to have lost the link between master and slave. In fact, they have not and the HA system is working normally, but WebAdmin does not show the correct status. This issue has, in almost most cases, been resolved either by rebooting the system or by an additional pattern which has been delivered on Monday and Tuesday (depending on the version). Although working correctly, we recommend that HA systems are rebooted at the next available maintenance window.

    If a license was uploaded during the 2-3 hour period, then the new license was not recognised (because of a missing library) and the system reverted to a trial license. Uploading a new license once the library was replaced corrected this.

    If the system was rebooted during the 2-3 hour period, the Astaro system fails to start. It was then necessary to log on through the console and manually recreate the missing directory and copy the missing libraries.

    I and my team are clearly embarrassed to have to report such a situation and we sincerely hope that you have not been too inconvenienced by this issue. I understand that this is not an acceptable level of quality and that you should, and do, expect better from Astaro. We need to earn your trust and have therefore immediately made some changes to our software delivery process to eliminate these mistakes and ensure that in future we do meet your expectations as a partner. 

    I'd also like to thank the people who have taken the trouble to help out their fellow Astaro users by posting constructive information here. It is really appreciated.

    Regards, Richard Walford
    VP Engineering, 
    Astaro
  • i'm curious why a pattern update is allowed to affect system files?

    Owner:  Emmanuel Technology Consulting

    http://etc-md.com

    Former Sophos SG(Astaro) advocate/researcher/Silver Partner

    PfSense w/Suricata, ntopng, 

    Other addons to follow

  • Asstaro is remoting my HA unit right now - colour me scared...
  • WOW! Thanks God I did the upgrade yesterday when the pattern already fixed!

    I was meant to upgrade the firmware from 7.504 to 7.507 on Friday as per Astaro email. I came to this forum to check if there is known problem with the new firmware. 
    And obviously some people had the problem on Saturday morning.

    My upgrade yesterday went fine until now,... well... network-wise... means no problem with all network traffic.... BUT..... in web admin, under Definitions, the Networks and Services just blank!

    My current state: 7.507 with pattern 20061.

    Anyone have this problem? Or probably I should open a new thread?
  • Hi guys,

    after running 7.502 for a longer time, i decided 2 weeks ago, to update onto 7.507. But dont´t wanna do this in one step, so i just scheduled the updates step after step to 503, 504 ....
    everything went good till the upgrade 505 to 506. The slave of my cluster was hung during up2date,while the master was still on 505 but with EDNS errors. So a manual reboot of the slave was necessary. After this the update the slave performs the update without a problem and switched to master. After the the formerly master synced and also performes the update.
    Seemed to be good, then i realised, that http proxying fails. 
    restarted the proxy service manually over the Webgui resolves this problem

    Now i´m running 506 with pattern 20076 and everything is good.

    Since Astaro told that patterns with 20000 and higher are´nt effected with the 2038 certificate problem, i´m wondering if  should update now to 507.

    Any Comments?

    CU 
    Thomas
  • @CyberMuz

    Thanks a ton Brother! for all that information ! u shud be in astaro team  rather [[[;)]]]


    You are quite welcome. It was my pleasure.

    And, I couldn't hang with these bad boys in the Astaro Dev team. I am no where near their level of being a bad @$$ code monkey. I am more of a project coordinator.

    Furthermore,

    I am happy to report that I got all my remote boxes upgraded to 7.507 last night without incident. Some were even starting from v7.504. But they had pattern versions of 2003x and above. Props to all!



    @Richard Walford

    Thank you so much for taking the time to reply to this thread. It means a lot to the community that the development team is participating in these processes with us. Yet, one little point *Chuckle* It has still never been stated exactly what Pattern Version number was at fault. Don't blame me, I am just the messenger. [[[;)]]] At this point, it really doesn't matter. Just a funny observation. You have my most sincerest gratitude anyways. So again, Thank You very much. [[[;)]]]

    P.S.
    Motivation for a resolution = Hell hath no fury like my father who could of woken up to a non-functioning router and couldn't telecommute in the morning. Potential seriously ugly situation.

    Be well my friends!
  • After upgrading to 7.507 today at 3 am (MEZ) iam not able to login via WebAdmin, i just see the browser-message: "Please wait, ..."  for an hour and nothing more happend. Rebooting does not fix the problem. On other ASGs I can see, that after the "Please wait,..." message a percent-loader is displayed, but on this ASG this loader is not displayed.

    As far as i can see all eths are up and all services are running... after typing the wrong password deliberately i even got the ASG mailmessage in my inbox that someone tried to access our ASG with the wrong password...

    but i would feel much better if webadmin works properly as well.


    Does anyone encounters the same problem? - And are there any hints whats going wrong here and how to fix it?


    TIA:Tricco


     (i tried to logon to CLI via COM-Port but i didnt set any credentials of loginuser or root, maybe there is a default pass? - i tried the credentials of the (web)admin user without success).
  • The default password for root is blank, IFF you never changed it or setup SSH access.

    Barry
  • Try using Firefox ... 7.506 introduced some problems with IE when accessing Webadmin.  it's probably all still there.

    WOW! Thanks God I did the upgrade yesterday when the pattern already fixed!

    I was meant to upgrade the firmware from 7.504 to 7.507 on Friday as per Astaro email. I came to this forum to check if there is known problem with the new firmware. 
    And obviously some people had the problem on Saturday morning.

    My upgrade yesterday went fine until now,... well... network-wise... means no problem with all network traffic.... BUT..... in web admin, under Definitions, the Networks and Services just blank!

    My current state: 7.507 with pattern 20061.

    Anyone have this problem? Or probably I should open a new thread?

    CTO, Convergent Information Security Solutions, LLC

    https://www.convergesecurity.com

    Advice given as posted on this forum does not construe a support relationship or other relationship with Convergent Information Security Solutions, LLC or its subsidiaries.  Use the advice given at your own risk.