[7.460][BUG][NOTABUG] Help! How can I diagnose lockup?

I believe that I locked-up my test machine (ASG220v1 512MB) when I attempted to edit the definition for a disconnected AD authentication server.

The ASG kept timing out, no matter which menu I tried to move to, so I started a new browser window.  I now get a "503 Service Temporarily Unavailable" page when I attempt to re-contact it.  Pings are answered almost instantly, so there's no connectivity problem.

What should I do at the CLI, or do I need to connect a keyboard and a monitor?

Thanks - Bob
Vista Pro SP1  -  IE 7.0.6001.18000
Parents
  • Thanks, Billybob, Is there any reason to try to see what's happening first?  Maybe run top to see if it's a specific program gone wild?  Anything else?
  • Probably wouldn't matter. You will have the required information in the log files anyways. I think its like when you try to connect to a shared network drive and the share is not available anymore. Windows kinda just hangs. I think same thing is happening with astaro but webadmin shouldn't die like this and should restart on its own even if it got hung. Maybe a bug?
    Try to reproduce it just to make sure.
    P.S. By the way, the log files are in /var/log directory. You can do tail -50 /var/log/httpd.log to see what is going on with webadmin. Other interesting logfiles might be under /var/log/system.log and /var/log/selfmon.log
  • It looks like a random glitch.  I couldn't connect on the external interface from another IP.  Unfortunately, I apparently had failed to reset the SSH passwords after the last reload, so I was unable to run anything from the CLI.  I cycled the power and have been unable to repeat the problem.

    Cheers - Bob
    PS I was also unable to access WebAdmin via the internal interface. 
    2009:06:26-13:51:56 astaro-1 httpd:  - - [26/Jun/2009:13:50:52 -0500] "GET / HTTP/1.1" 503 323

    --------------------------------------------------------------------
    Following are the logfiles from when it locked up before I started this thread.

    Here's httpd:
    2009:06:26-10:34:48 astaro-1 httpd:  - - [26/Jun/2009:10:33:44 -0500] "POST /index.plx HTTP/1.1" 503 323
    
    2009:06:26-10:35:45 astaro-1 httpd:  - - [26/Jun/2009:10:34:41 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:47 astaro-1 httpd:  - - [26/Jun/2009:10:34:42 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:48 astaro-1 httpd[32715]: [error] [client 127.0.0.1] access to /var/webadmin/ failed, reason: SSL connection required
    2009:06:26-10:35:48 astaro-1 httpd: 127.0.0.1 - - [26/Jun/2009:10:35:48 -0500] "GET /" 403 -
    2009:06:26-10:35:48 astaro-1 httpd:  - - [26/Jun/2009:10:34:44 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:48 astaro-1 httpd:  - - [26/Jun/2009:10:34:44 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:48 astaro-1 httpd[32412]: [error] [client 127.0.0.1] access to /var/webadmin/ failed, reason: SSL connection required
    2009:06:26-10:35:48 astaro-1 httpd: 127.0.0.1 - - [26/Jun/2009:10:35:48 -0500] "GET /" 403 -
    2009:06:26-10:35:49 astaro-1 httpd[30774]: [error] [client 127.0.0.1] access to /var/webadmin/ failed, reason: SSL connection required
    2009:06:26-10:35:49 astaro-1 httpd: 127.0.0.1 - - [26/Jun/2009:10:35:49 -0500] "GET /" 403 -

    Here's selfmon:
    2009:06:26-10:03:50 astaro-1 selfmonng[3041]: W NOTIFYEVENT Name=ctasd_connect Level=WARN Id=129 suppressed
    
    2009:06:26-10:19:35 astaro-1 selfmonng[3041]: I check Failed increment ctasd_connect counter 1 - 2
    2009:06:26-10:35:20 astaro-1 selfmonng[3041]: W check Failed increment ctasd_connect counter 2 - 2
    2009:06:26-10:35:21 astaro-1 selfmonng[3041]: astaro::logging:checkParameters() getting parameters for logitem 'WARN-129' failed
    2009:06:26-10:35:21 astaro-1 selfmonng[3041]: W NOTIFYEVENT Name=ctasd_connect Level=WARN Id=129 sent
    2009:06:26-10:51:06 astaro-1 selfmonng[3041]: I check Failed increment ctasd_connect counter 1 - 2

    Here's the system log:
    2009:06:26-10:30:01 astaro-1 /usr/sbin/cron[32380]: (root) CMD (nice -n19 /usr/local/bin/create_rrd_graphs.plx)
    
    2009:06:26-10:30:01 astaro-1 /usr/sbin/cron[32382]: (root) CMD (   /usr/local/bin/reportcontrol.sh)
    2009:06:26-10:31:01 astaro-1 /usr/sbin/cron[32423]: (root) CMD (/sbin/audld.plx --trigger)
    2009:06:26-10:32:02 astaro-1 /usr/sbin/cron[32663]: (root) CMD (  nice -n19 /usr/local/bin/gen_inline_reporting_data.plx)
    2009:06:26-10:35:01 astaro-1 /usr/sbin/cron[32720]: (root) CMD (   /usr/local/bin/reportcontrol.sh)
    2009:06:26-10:40:01 astaro-1 /usr/sbin/cron[391]: (root) CMD (   /usr/local/bin/reportcontrol.sh)
    2009:06:26-10:43:59 astaro-1 daemon-watcher[3044]: Watching selfmonng.plx - running fine
  • I've had this happen to me once, on 7.40x; also saw similar messages in the httpd log; posted about it here somewhere, but I don't think there was an official response.

    Barry
  • Astaro Beta Report
    --------------------------------
    Version: 7.460
    Type: BUG
    State: NOTABUG
    Reporter: BAlfson
    Contributor: 
    MantisID: 
    --------------------------------
Reply Children
  • Hi,

    2009:06:26-10:35:49 astaro-1 httpd[30774]: [error] [client 127.0.0.1] access to /var/webadmin/ failed, reason: SSL connection required
    2009:06:26-10:35:49 astaro-1 httpd: 127.0.0.1 - - [26/Jun/2009:10:35:49 -0500] "GET /" 403 -

    This is a "normal" message who is not critical. But is not related to your reported problem. Could you tell us which output following commands have? We are not able to reproduce it

    ps aux | grep httpd

    /etc/init.d/httpd status

    or get the webadmin port 4444 maybe dropped by afc or ips? You will find some information at /var/log/ips.log or /var/log/afc.log

    Greetings

    Andreas