This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Arbitrary restart of ASG 120

One of my 4 ASG units has spontaineously restarted in the middle of the day twice in the last 10 days. It's on a UPS and no one at the site has reported any power flux anyway. I just get a message that says system was restarted reason unknown. Where to start finding out why?


This thread was automatically locked due to age.
Parents
  • Well, I probably wouldn't know what was interesting or not. Here is a sample from the system log just before and after the restart: It looks to me that it just restarted at 10:52 without warning.

    2010:11:15-10:49:48 CalcoBR ntpd[4829]: synchronized to 173.203.202.87, stratum 2
    2010:11:15-10:50:01 CalcoBR /usr/sbin/cron[463]: (root) CMD (   /usr/local/bin/reportcontrol.sh)
    2010:11:15-10:52:38 (none) syslog-ng[2655]: syslog-ng version 1.6.7 starting
    2010:11:15-10:52:48 (none) sysmond[2907]: sysmond 1.16 starting
    2010:11:15-10:52:48 (none) sysmond[2907]: daemonizing
    2010:11:15-10:52:51 (none) count_active_ip[2936]: count_active_ip 1.19: checking active IP addresses
    2010:11:15-10:52:51 (none) count_active_ip[2936]: Unlimited License - no counting needed
    2010:11:15-10:52:57 (none) /usr/sbin/cron[3043]: (CRON) STARTUP (V5.0)
    2010:11:15-10:52:58 (none) postgres[3145]: [1-1] LOG:  could not create IPv6 socket: Address family not supported by protocol
    2010:11:15-10:52:58 (none) postgres[3150]: [2-1] LOG:  database system was interrupted; last known up at 2010-11-15 10:49:10 CST
    2010:11:15-10:52:58 (none) postgres[3150]: [3-1] LOG:  database system was not properly shut down; automatic recovery in progress
    2010:11:15-10:52:58 (none) postgres[3150]: [4-1] LOG:  redo starts at 7/5370E00
    2010:11:15-10:52:58 (none) postgres[3151]: [2-1] FATAL:  the database system is starting up
    2010:11:15-10:52:58 (none) postgres[3150]: [5-1] LOG:  unexpected pageaddr 7/33CA000 in log file 7, segment 5, offset 3973120
    2010:11:15-10:52:58 (none) postgres[3150]: [6-1] LOG:  redo done at 7/53C9F50
    2010:11:15-10:52:58 (none) postgres[3150]: [7-1] LOG:  last completed transaction was at log time 2010-11-15 10:50:49.952029-06
    2010:11:15-10:52:59 (none) postgres[3154]: [2-1] LOG:  autovacuum launcher started
    2010:11:15-10:52:59 (none) postgres[3145]: [2-1] LOG:  database system is ready to accept connections
    2010:11:15-10:53:02 (none) daemon-watcher[3244]: This is daemon-watcher v1.1.10.1 2008/09/25 11:07:55 opolm  starting...
    2010:11:15-10:53:02 (none) daemon-watcher[3244]: Watching selfmonng.plx...
    2010:11:15-10:53:13 (none) syslog-ng[2655]: SIGHUP received, restarting syslog-ng
    2010:11:15-10:53:13 (none) /usr/sbin/cron[3628]: (CRON) STARTUP (V5.0)
    2010:11:15-10:53:14 (none) syslog-ng[2655]: new configuration initialized
    2010:11:15-10:53:22 (none) snmpd[3582]: error finding row index in _ifXTable_container_row_restore
    2010:11:15-10:53:23 (none) snmpd[3582]: NET-SNMP version 5.4.2.1
    2010:11:15-10:53:23 (none) snmpd[3582]: Received TERM or STOP signal...  shutting down...
    2010:11:15-10:53:24 (none) syslog-ng[2655]: syslog-ng version 1.6.7 going down
    2010:11:15-10:53:28 CalcoBR syslog-ng[3930]: syslog-ng version 1.6.7 starting
    2010:11:15-10:53:54 CalcoBR syslog-ng[3930]: SIGHUP received, restarting syslog-ng
    2010:11:15-10:53:55 CalcoBR syslog-ng[3930]: new configuration initialized
    2010:11:15-10:54:01 CalcoBR /usr/sbin/cron[3628]: (*system*) RELOAD (/etc/crontab)
    2010:11:15-10:54:14 CalcoBR ntpd[4212]: ntpd 4.2.4p8@1.1612-o Tue Feb  2 21:46:54 UTC 2010 (1)
    2010:11:15-10:54:15 CalcoBR ntpd[4230]: precision = 2.000 usec
    2010:11:15-10:54:15 CalcoBR ntpd[4230]: ntp_io: estimated max descriptors: 1024, initial socket boundary: 16
    2010:11:15-10:54:15 CalcoBR ntpd[4230]: Listening on interface #0 wildcard, 0.0.0.0#123 Disabled
    2010:11:15-10:54:15 CalcoBR ntpd[4230]: Listening on interface #1 lo, 127.0.0.1#123 Enabled
    2010:11:15-10:54:15
  • These can be challenging to ID.  Looking through logs is not really fun, but that is the best I can suggest- kernel, fallback, selfmonitoring, middleware- those are where I would start.  You do have a pretty narrow time window to review.

    The unit isn't overheating, is it?  Vents clogged or blocked, fan not spinning, sitting on something hot?
Reply
  • These can be challenging to ID.  Looking through logs is not really fun, but that is the best I can suggest- kernel, fallback, selfmonitoring, middleware- those are where I would start.  You do have a pretty narrow time window to review.

    The unit isn't overheating, is it?  Vents clogged or blocked, fan not spinning, sitting on something hot?
Children
No Data