[7.460][BUG][NOTABUG] Help! How can I diagnose lockup?

I believe that I locked-up my test machine (ASG220v1 512MB) when I attempted to edit the definition for a disconnected AD authentication server.

The ASG kept timing out, no matter which menu I tried to move to, so I started a new browser window.  I now get a "503 Service Temporarily Unavailable" page when I attempt to re-contact it.  Pings are answered almost instantly, so there's no connectivity problem.

What should I do at the CLI, or do I need to connect a keyboard and a monitor?

Thanks - Bob
Vista Pro SP1  -  IE 7.0.6001.18000
Parents
  • Thanks, Billybob, Is there any reason to try to see what's happening first?  Maybe run top to see if it's a specific program gone wild?  Anything else?
  • Probably wouldn't matter. You will have the required information in the log files anyways. I think its like when you try to connect to a shared network drive and the share is not available anymore. Windows kinda just hangs. I think same thing is happening with astaro but webadmin shouldn't die like this and should restart on its own even if it got hung. Maybe a bug?
    Try to reproduce it just to make sure.
    P.S. By the way, the log files are in /var/log directory. You can do tail -50 /var/log/httpd.log to see what is going on with webadmin. Other interesting logfiles might be under /var/log/system.log and /var/log/selfmon.log
  • It looks like a random glitch.  I couldn't connect on the external interface from another IP.  Unfortunately, I apparently had failed to reset the SSH passwords after the last reload, so I was unable to run anything from the CLI.  I cycled the power and have been unable to repeat the problem.

    Cheers - Bob
    PS I was also unable to access WebAdmin via the internal interface. 
    2009:06:26-13:51:56 astaro-1 httpd:  - - [26/Jun/2009:13:50:52 -0500] "GET / HTTP/1.1" 503 323

    --------------------------------------------------------------------
    Following are the logfiles from when it locked up before I started this thread.

    Here's httpd:
    2009:06:26-10:34:48 astaro-1 httpd:  - - [26/Jun/2009:10:33:44 -0500] "POST /index.plx HTTP/1.1" 503 323
    
    2009:06:26-10:35:45 astaro-1 httpd:  - - [26/Jun/2009:10:34:41 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:47 astaro-1 httpd:  - - [26/Jun/2009:10:34:42 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:48 astaro-1 httpd[32715]: [error] [client 127.0.0.1] access to /var/webadmin/ failed, reason: SSL connection required
    2009:06:26-10:35:48 astaro-1 httpd: 127.0.0.1 - - [26/Jun/2009:10:35:48 -0500] "GET /" 403 -
    2009:06:26-10:35:48 astaro-1 httpd:  - - [26/Jun/2009:10:34:44 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:48 astaro-1 httpd:  - - [26/Jun/2009:10:34:44 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:48 astaro-1 httpd[32412]: [error] [client 127.0.0.1] access to /var/webadmin/ failed, reason: SSL connection required
    2009:06:26-10:35:48 astaro-1 httpd: 127.0.0.1 - - [26/Jun/2009:10:35:48 -0500] "GET /" 403 -
    2009:06:26-10:35:49 astaro-1 httpd[30774]: [error] [client 127.0.0.1] access to /var/webadmin/ failed, reason: SSL connection required
    2009:06:26-10:35:49 astaro-1 httpd: 127.0.0.1 - - [26/Jun/2009:10:35:49 -0500] "GET /" 403 -

    Here's selfmon:
    2009:06:26-10:03:50 astaro-1 selfmonng[3041]: W NOTIFYEVENT Name=ctasd_connect Level=WARN Id=129 suppressed
    
    2009:06:26-10:19:35 astaro-1 selfmonng[3041]: I check Failed increment ctasd_connect counter 1 - 2
    2009:06:26-10:35:20 astaro-1 selfmonng[3041]: W check Failed increment ctasd_connect counter 2 - 2
    2009:06:26-10:35:21 astaro-1 selfmonng[3041]: astaro::logging:checkParameters() getting parameters for logitem 'WARN-129' failed
    2009:06:26-10:35:21 astaro-1 selfmonng[3041]: W NOTIFYEVENT Name=ctasd_connect Level=WARN Id=129 sent
    2009:06:26-10:51:06 astaro-1 selfmonng[3041]: I check Failed increment ctasd_connect counter 1 - 2

    Here's the system log:
    2009:06:26-10:30:01 astaro-1 /usr/sbin/cron[32380]: (root) CMD (nice -n19 /usr/local/bin/create_rrd_graphs.plx)
    
    2009:06:26-10:30:01 astaro-1 /usr/sbin/cron[32382]: (root) CMD (   /usr/local/bin/reportcontrol.sh)
    2009:06:26-10:31:01 astaro-1 /usr/sbin/cron[32423]: (root) CMD (/sbin/audld.plx --trigger)
    2009:06:26-10:32:02 astaro-1 /usr/sbin/cron[32663]: (root) CMD (  nice -n19 /usr/local/bin/gen_inline_reporting_data.plx)
    2009:06:26-10:35:01 astaro-1 /usr/sbin/cron[32720]: (root) CMD (   /usr/local/bin/reportcontrol.sh)
    2009:06:26-10:40:01 astaro-1 /usr/sbin/cron[391]: (root) CMD (   /usr/local/bin/reportcontrol.sh)
    2009:06:26-10:43:59 astaro-1 daemon-watcher[3044]: Watching selfmonng.plx - running fine
Reply
  • It looks like a random glitch.  I couldn't connect on the external interface from another IP.  Unfortunately, I apparently had failed to reset the SSH passwords after the last reload, so I was unable to run anything from the CLI.  I cycled the power and have been unable to repeat the problem.

    Cheers - Bob
    PS I was also unable to access WebAdmin via the internal interface. 
    2009:06:26-13:51:56 astaro-1 httpd:  - - [26/Jun/2009:13:50:52 -0500] "GET / HTTP/1.1" 503 323

    --------------------------------------------------------------------
    Following are the logfiles from when it locked up before I started this thread.

    Here's httpd:
    2009:06:26-10:34:48 astaro-1 httpd:  - - [26/Jun/2009:10:33:44 -0500] "POST /index.plx HTTP/1.1" 503 323
    
    2009:06:26-10:35:45 astaro-1 httpd:  - - [26/Jun/2009:10:34:41 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:47 astaro-1 httpd:  - - [26/Jun/2009:10:34:42 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:48 astaro-1 httpd[32715]: [error] [client 127.0.0.1] access to /var/webadmin/ failed, reason: SSL connection required
    2009:06:26-10:35:48 astaro-1 httpd: 127.0.0.1 - - [26/Jun/2009:10:35:48 -0500] "GET /" 403 -
    2009:06:26-10:35:48 astaro-1 httpd:  - - [26/Jun/2009:10:34:44 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:48 astaro-1 httpd:  - - [26/Jun/2009:10:34:44 -0500] "POST /index.plx HTTP/1.1" 503 323
    2009:06:26-10:35:48 astaro-1 httpd[32412]: [error] [client 127.0.0.1] access to /var/webadmin/ failed, reason: SSL connection required
    2009:06:26-10:35:48 astaro-1 httpd: 127.0.0.1 - - [26/Jun/2009:10:35:48 -0500] "GET /" 403 -
    2009:06:26-10:35:49 astaro-1 httpd[30774]: [error] [client 127.0.0.1] access to /var/webadmin/ failed, reason: SSL connection required
    2009:06:26-10:35:49 astaro-1 httpd: 127.0.0.1 - - [26/Jun/2009:10:35:49 -0500] "GET /" 403 -

    Here's selfmon:
    2009:06:26-10:03:50 astaro-1 selfmonng[3041]: W NOTIFYEVENT Name=ctasd_connect Level=WARN Id=129 suppressed
    
    2009:06:26-10:19:35 astaro-1 selfmonng[3041]: I check Failed increment ctasd_connect counter 1 - 2
    2009:06:26-10:35:20 astaro-1 selfmonng[3041]: W check Failed increment ctasd_connect counter 2 - 2
    2009:06:26-10:35:21 astaro-1 selfmonng[3041]: astaro::logging:checkParameters() getting parameters for logitem 'WARN-129' failed
    2009:06:26-10:35:21 astaro-1 selfmonng[3041]: W NOTIFYEVENT Name=ctasd_connect Level=WARN Id=129 sent
    2009:06:26-10:51:06 astaro-1 selfmonng[3041]: I check Failed increment ctasd_connect counter 1 - 2

    Here's the system log:
    2009:06:26-10:30:01 astaro-1 /usr/sbin/cron[32380]: (root) CMD (nice -n19 /usr/local/bin/create_rrd_graphs.plx)
    
    2009:06:26-10:30:01 astaro-1 /usr/sbin/cron[32382]: (root) CMD (   /usr/local/bin/reportcontrol.sh)
    2009:06:26-10:31:01 astaro-1 /usr/sbin/cron[32423]: (root) CMD (/sbin/audld.plx --trigger)
    2009:06:26-10:32:02 astaro-1 /usr/sbin/cron[32663]: (root) CMD (  nice -n19 /usr/local/bin/gen_inline_reporting_data.plx)
    2009:06:26-10:35:01 astaro-1 /usr/sbin/cron[32720]: (root) CMD (   /usr/local/bin/reportcontrol.sh)
    2009:06:26-10:40:01 astaro-1 /usr/sbin/cron[391]: (root) CMD (   /usr/local/bin/reportcontrol.sh)
    2009:06:26-10:43:59 astaro-1 daemon-watcher[3044]: Watching selfmonng.plx - running fine
Children