This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Problem with WebAdmin webserver - random restarts of UTM

Hello,

I have some Problems with my UTM220 since today.
The system randomly reboot itself, saying reason unknown.
The following e-mails are sent to me after a reboot:

1)
WebAdmin webserver not running - restarted
-- 
System Uptime      : 0 days 0 hours 1 minute
System Load        : 0.29
System Version     : Sophos UTM 9.203-3


2)
System was restarted
Reason: (unknown)

-- 
System Uptime      : 0 days 0 hours 1 minute
System Load        : 0.75
System Version     : Sophos UTM 9.203-3


Some minutes ago it was already the 6th reboot today!

I have already read the following threads but they didn't help me:
https://community.sophos.com/products/unified-threat-management/astaroorg/f/68/t/61560
https://community.sophos.com/products/unified-threat-management/astaroorg/f/51/t/22269
https://community.sophos.com/products/unified-threat-management/astaroorg/f/51/t/22302
https://community.sophos.com/products/unified-threat-management/astaroorg/f/53/t/34461

Today only 2 Up2Date Patterns are installed: 10:24 version 63268 and 11:12 version 63270.
Close reboots to this time was 10:29 and 11:23. At 10:47 there was also a reboot.

Selfmon.log says the following for today:
2014:06:30-00:11:45 fsp-astaro selfmonng[3937]: I check Failed increment ctasd_inbound_mem_usage counter 1 - 10
2014:06:30-00:11:45 fsp-astaro selfmonng[3937]: I check Failed increment ctasd_outbound_mem_usage counter 1 - 10
2014:06:30-01:05:24 fsp-astaro selfmonng[3937]: I check Failed increment ctasd_inbound_connect counter 1 - 2
2014:06:30-01:06:09 fsp-astaro selfmonng[3937]: I check Failed increment ctasd_outbound_connect counter 1 - 2
2014:06:30-05:12:27 fsp-astaro selfmonng[3937]: I check Failed increment ctasd_inbound_mem_usage counter 1 - 10
2014:06:30-05:12:27 fsp-astaro selfmonng[3937]: I check Failed increment ctasd_outbound_mem_usage counter 1 - 10
2014:06:30-08:42:29 fsp-astaro selfmonng[3949]: T Selfmonitor Daemon successfully started
2014:06:30-08:42:30 fsp-astaro selfmonng[3949]: T Loading Selfmonitoring Checks complete  new=83 failed=0 retained=0 dropped=0
2014:06:30-08:42:34 fsp-astaro selfmonng[3949]: I check Failed increment webadmin_running counter 1 - 3
2014:06:30-08:42:39 fsp-astaro selfmonng[3949]: I check Failed increment webadmin_running counter 2 - 3
2014:06:30-08:42:44 fsp-astaro selfmonng[3949]: W check Failed increment webadmin_running counter 3 - 3
2014:06:30-08:42:44 fsp-astaro selfmonng[3949]: [INFO-107] WebAdmin webserver not running - restarted
2014:06:30-08:42:44 fsp-astaro selfmonng[3949]: W NOTIFYEVENT Name=webadmin_running Level=INFO Id=107 sent
2014:06:30-08:42:44 fsp-astaro selfmonng[3949]: W triggerAction: 'cmd'
2014:06:30-08:42:44 fsp-astaro selfmonng[3949]: W actionCmd(+):  '/etc/rc.d/httpd restart'
2014:06:30-08:42:45 fsp-astaro selfmonng[3949]: W child returned status: exit='0' signal='0'
2014:06:30-08:42:59 fsp-astaro selfmonng[3949]: T read config file '/etc/selfmonng.conf'Jun 30 08:43:00 selfmonng[3949]: I check Failed increment ctipd_running counter 1 - 3
2014:06:30-08:57:26 fsp-astaro selfmonng[3945]: T Selfmonitor Daemon successfully started
2014:06:30-08:57:27 fsp-astaro selfmonng[3945]: T Loading Selfmonitoring Checks complete  new=83 failed=0 retained=0 dropped=0
2014:06:30-08:57:31 fsp-astaro selfmonng[3945]: I check Failed increment webadmin_running counter 1 - 3
2014:06:30-08:57:36 fsp-astaro selfmonng[3945]: I check Failed increment webadmin_running counter 2 - 3
2014:06:30-08:57:41 fsp-astaro selfmonng[3945]: W check Failed increment webadmin_running counter 3 - 3
2014:06:30-08:57:41 fsp-astaro selfmonng[3945]: [INFO-107] WebAdmin webserver not running - restarted
2014:06:30-08:57:41 fsp-astaro selfmonng[3945]: W NOTIFYEVENT Name=webadmin_running Level=INFO Id=107 sent
2014:06:30-08:57:41 fsp-astaro selfmonng[3945]: W triggerAction: 'cmd'
2014:06:30-08:57:41 fsp-astaro selfmonng[3945]: W actionCmd(+):  '/etc/rc.d/httpd restart'
2014:06:30-08:57:42 fsp-astaro selfmonng[3945]: W child returned status: exit='0' signal='0'
2014:06:30-08:57:56 fsp-astaro selfmonng[3945]: T read config file '/etc/selfmonng.conf'Jun 30 08:57:57 selfmonng[3945]: I check Failed increment ctipd_running counter 1 - 3
2014:06:30-08:58:06 fsp-astaro selfmonng[3945]: I check Failed increment service_monitor_running counter 1 - 3

I stopped copying after the second restard because the following are identical entries.

Hardware usage is in normal range, nothing big different compared to the last weeks.

--
Update:
Looks like it is getting worse and worse, got now the 9th reboot of the UTM today [:@]

Does anyone have some ideas?

Best regards
Chris


Update 2:
After some more reboots I manually shut down the UTM, unplugged the power cord and waited some minutes. Replugged the power and since then the UTM is running fine, just as it is supposed to!

Regardless I have opened an support case at my distributor and he passed it to Sophos. With them I want to know why the restarts occurred.
I'll post the results in this thread just in case if more get this error.


This thread was automatically locked due to age.
Parents
  • Hi Micky, you were right after a manual restart the restarts from the sophos stopped.

    In the meantime I have checked this issue with sophos support. In the utm logs they haven't found anything. They told me that only a serial logging could helb identify the problem but I don't have it enabled and since my manual restart the problem did not come back.

    So at least I can give you some hint if you are facing the same problem.
    Manual shutdown the utm, plug off the power cord, wait for about a minute and boot it again. If the reboots are still there, enable a serial logging.
    The instructions I have from sophos are on german but I guess with google translate it should be no problem for understanding it.

    Aktivierung des seriellen Loggings:
    =========================
    Verbindung per SSH als Benutzer root
    mount -o remount, rw /boot

    Danach folgende Dateien editieren:
    /boot/grub/menu.lst und /boot/grub/menu.lst-default

    Bitte folgendermaßen editieren:
    Die Zeile sollte so aussehen, dass am Ende der Zeilte console=ttyS0,38400 steht
    z.B. kernel /boot/vmlinuz root=/dev/disk/by-label/root vga=normal video=ofonly splash=silent console=ttyS0,38400

    Dann bitte folgendes eingeben:
    umount /boot/
    mount -o ro /boot/
    anschließend starten Sie die UTM bitte neu

    ###############################
    ACHTUNG! Je nach System kann der Parameter console=ttyS1 oder console=ttyUSB0 sein
    Um dies herauszufinden, können Sie sich z.B. per Putty und seriellem Kabel verbinden und
    folgenden Befehl absetzen:

    echo 'test' > /dev/ttyS0
    echo 'test' > /dev/ttyS1
    echo 'test' > /dev/ttyUSB0

    Bei einem der Befehle sollte 'test' in der Putty-Session sichtbar sein. 
    Die Kernel-Zeilen in den beiden zu editierenden Dateien müssen selbstverständlich entsprechend
    der korrekten seriellen Verbindung (/dev/tty..) angepasst werden.
    ###############################

    - In Putty den Connection type auf Serial stellen - Speed: 38400
      - Unter Session->Logging das Logging für all session output aktivieren.
      - Speicherort der Log Datei angeben.


    Bitte beachten Sie, dass bereits der Neustart nach Anpassung der Konfiguration in das putty.log
    protokolliert sein sollte. Ist dies nicht der Fall, liegt ein Fehler in der Konfiguration vor.
    Bitte prüfen Sie die Konfiguration und stellen Sie sicher, dass sämtliche Schritte gem. der 
    Anleitung durchgeführt wurden.


    Regards
    Chris
Reply
  • Hi Micky, you were right after a manual restart the restarts from the sophos stopped.

    In the meantime I have checked this issue with sophos support. In the utm logs they haven't found anything. They told me that only a serial logging could helb identify the problem but I don't have it enabled and since my manual restart the problem did not come back.

    So at least I can give you some hint if you are facing the same problem.
    Manual shutdown the utm, plug off the power cord, wait for about a minute and boot it again. If the reboots are still there, enable a serial logging.
    The instructions I have from sophos are on german but I guess with google translate it should be no problem for understanding it.

    Aktivierung des seriellen Loggings:
    =========================
    Verbindung per SSH als Benutzer root
    mount -o remount, rw /boot

    Danach folgende Dateien editieren:
    /boot/grub/menu.lst und /boot/grub/menu.lst-default

    Bitte folgendermaßen editieren:
    Die Zeile sollte so aussehen, dass am Ende der Zeilte console=ttyS0,38400 steht
    z.B. kernel /boot/vmlinuz root=/dev/disk/by-label/root vga=normal video=ofonly splash=silent console=ttyS0,38400

    Dann bitte folgendes eingeben:
    umount /boot/
    mount -o ro /boot/
    anschließend starten Sie die UTM bitte neu

    ###############################
    ACHTUNG! Je nach System kann der Parameter console=ttyS1 oder console=ttyUSB0 sein
    Um dies herauszufinden, können Sie sich z.B. per Putty und seriellem Kabel verbinden und
    folgenden Befehl absetzen:

    echo 'test' > /dev/ttyS0
    echo 'test' > /dev/ttyS1
    echo 'test' > /dev/ttyUSB0

    Bei einem der Befehle sollte 'test' in der Putty-Session sichtbar sein. 
    Die Kernel-Zeilen in den beiden zu editierenden Dateien müssen selbstverständlich entsprechend
    der korrekten seriellen Verbindung (/dev/tty..) angepasst werden.
    ###############################

    - In Putty den Connection type auf Serial stellen - Speed: 38400
      - Unter Session->Logging das Logging für all session output aktivieren.
      - Speicherort der Log Datei angeben.


    Bitte beachten Sie, dass bereits der Neustart nach Anpassung der Konfiguration in das putty.log
    protokolliert sein sollte. Ist dies nicht der Fall, liegt ein Fehler in der Konfiguration vor.
    Bitte prüfen Sie die Konfiguration und stellen Sie sicher, dass sämtliche Schritte gem. der 
    Anleitung durchgeführt wurden.


    Regards
    Chris
Children
No Data