This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Netconsole to Troubleshoot Astaro Crashes?

I've got a situation with an ASL 6.301 machine that is seemingly randomly crashing and hanging. I believe it's likely a hardware problem, but it would be nice if I had a way to remotely view the console through something like the netconsole Linux utilities.

Anyone ever do something similar when they don't have physical access to the machine?

Even remote/network syslogging might be helpful. In this case, nothing is getting written to disk so the logs aren't helpful.


This thread was automatically locked due to age.
Parents
  • Hi

    I had also some strange hangers with 6.301...
    so i opend a case by astaro, and they send me this script, wich i should let run in the background 

    "./script.sh &"

    this script should log the kernel errors.... because i had not enough time, i was not abble till now to test this... my ASL now runs on 6.300 since 10 days without an error... look at this thread for my probs....

    http://astaro.org/showthread.php?t=16227

    hardware looks good, with 6.300 also now crash, unlike with 6.301

    the script:

    #!/bin/bash
    #
    # Collects information for oops decoding
    #
    # $Id: oops-info.sh,v 1.3 2004/08/31 15:08:49 dennis Exp $
    #
    # HOWTO: just start this script without any parameter and wait for oops.
    # The script will create a subdirectory named "oops-info.d" an than keep
    # storing relevant data every 5 seconds. If you interrupt it with "Ctrl-C",
    # it will create a tarball "oops-info.d.tar.bz2" with stored data.
    #
    # After an oops occures, you have to carefully tipewrite or screenshot
    # with a digicam the oops message appeared on the screen; after that
    # send the oops data along with data stored in "oops-info.d" directory
    # to kernel maintainer or upload them into Mantis. 
    #  

    INFO_DIR="oops-info.d"
    SLEEP_TIME=5
    SWINFO="/usr/local/bin/swinfo"
    HWINFO="/usr/sbin/hwinfo"

    function error
    {
        echo $@ >&2
        exit 1
    }

    function store
    {
        name=$(basename $1)
        cat $1 > $INFO_DIR/$name || error "Could not store $1"
    }

    function pack
    {
        echo "Creating a tarball"
        tar -cvjf $INFO_DIR.tar.bz2 $INFO_DIR
        exit $?
    }

    trap pack INT

    rm -rf $INFO_DIR
    mkdir $INFO_DIR || error "Could not creade info dir"

    if [ -x $SWINFO ] ; then
        echo "Storing software info, please wait"
        $SWINFO > $INFO_DIR/swinfo 2>/dev/null
    fi

    if [ -x $HWINFO ] ; then
        echo "Storing hardware info, please wait"
        $HWINFO --log $INFO_DIR/hwinfo --all
    fi

    echo "Storing /proc info for oops decode"
    store /proc/version

    while true ; do
        store /proc/modules
        store /proc/ksyms
        date > $INFO_DIR/timestamp
        cat $INFO_DIR/timestamp
        echo "/proc data stored"
        echo -e "Waiting $SLEEP_TIME seconds. Press Ctrl+C to interrupt\n"
        sleep $SLEEP_TIME
    done


    #
    # $Log: oops-info.sh,v $
    # Revision 1.3  2004/08/31 15:08:49  dennis
    # Store timestamp
    #
    # Revision 1.2  2004/06/17 13:48:53  dennis
    # HOWTO added
    #
    # Revision 1.1  2004/06/17 13:23:54  dennis
    # Initial version
    #
    #
  • Thanks for the info. I don't think it's related to 6.301 as it was behaving the same with 6.300 and older as well.

    If I ever get a KVM-ip plugged into it I'll be able to troubleshoot it, but for now it's easier to just buy replacement hardware.
Reply
  • Thanks for the info. I don't think it's related to 6.301 as it was behaving the same with 6.300 and older as well.

    If I ever get a KVM-ip plugged into it I'll be able to troubleshoot it, but for now it's easier to just buy replacement hardware.
Children
No Data