This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Astaro Rebooting for no Reason

I have UTM 9 with a purchased subscription.
Here's the background info:
Had Astaro 8 in a physical machine serving 50 or 60 devices. It never crashed or gave me any issues at all.
Decided to virtualize in Hyper-V and upgrade to UTM 9 serving the same amount of devices. Server randomly reboots
Spent multiple hours with support, this form, log files, reconfiguring from scratch, etc. Nothing helped. I still exprienced random reboots.
Moved UTM 9 to a physical machine last Friday: same random reboots for no apparent reason.

This situation is extremely frustrating. I'm going to downgrade to 8 -- when all users leave the office and waste just a little bit more of my time to keep giving this distro a shot as I already paid for it.

If anyone has got ANY suggestion please help! I'm desperate and extremely frustrated now. Please do NOT suggest:
It's a UPS problem
CPU cooling issue
Reconfigure from scratch
Serious corruption


This thread was automatically locked due to age.
Parents
  • 1. NUMA config is good. All of the other VMs run without a problem
    2. I don't think Linux supports dynamic memory so I never enable it for Linux VMs
    3. I see the exact same bahavior on a physical machine (current setup)
    4. The logs have nothing. Here's an extract:

    boot log:

    2013:03:18-09:48:53 gdl-firewall kernel: [    6.276929] EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: discard
    2013:03:18-09:48:53 gdl-firewall kernel: [    6.290687] EXT4-fs (sda5): mounted filesystem with ordered data mode. Opts: discard
    2013:03:18-09:48:53 gdl-firewall kernel: [    6.307816] EXT4-fs (sda7): mounted filesystem with ordered data mode. Opts: discard
    2013:03:18-09:48:53 gdl-firewall kernel: [    6.319771] EXT4-fs (sda8): mounted filesystem with ordered data mode. Opts: discard
    2013:03:18-09:48:53 gdl-firewall kernel: [    6.824933] RED: starting, Copyright (c) 2009 Sven Schnelle 
    2013:03:18-09:48:55 gdl-firewall syslog-ng[2763]: Termination requested via signal, terminating;
    2013:03:18-09:48:55 gdl-firewall syslog-ng[2763]: syslog-ng shutting down; version='3.0.10'
    2013:03:18-09:52:56 gdl-firewall kernel: [    0.000000] Linux version 3.3.8-74.g487ae8c-smp (abuild@axgbuild) (gcc version 4.3.4 [gcc-4_3-branch revision 152973] (SUSE Linux) ) #1 SMP Mon Jan 21 14:28:45 UTC 2013
    2013:03:18-09:52:56 gdl-firewall kernel: [    0.000000] BIOS-provided physical RAM map:
    2013:03:18-09:52:56 gdl-firewall kernel: [    0.000000]  BIOS-e820: 0000000000000000 - 000000000009ec00 (usable)
    2013:03:18-09:52:56 gdl-firewall kernel: [    0.000000]  BIOS-e820: 000000000009ec00 - 00000000000a0000 (reserved)


    Fallback log:

    2013:03:18-09:32:42 gdl-firewall [daemon[:D]ebug] rrdcached[3629]:  rotating journals
    2013:03:18-09:32:42 gdl-firewall [daemon[:D]ebug] rrdcached[3629]:  started new journal /var/log/reporting/rrd/rrd.journal.1363620762.335447
    2013:03:18-09:32:42 gdl-firewall [daemon[:D]ebug] rrdcached[3629]:  removing old journal /var/log/reporting/rrd/rrd.journal.1363613562.335442
    2013:03:18-09:35:58 gdl-firewall [daemon:info] irqd[3190]:  ppp1 ppp  
    2013:03:18-09:36:00 gdl-firewall [daemon:info] irqd[3190]:  ppp1 ppp  
    2013:03:18-09:48:55 gdl-firewall [daemon:info] acpid:  starting up
    2013:03:18-09:48:55 gdl-firewall [daemon:info] acpid:  1 rule loaded
    2013:03:18-09:48:55 gdl-firewall [daemon:info] acpid:  waiting for events: event logging is off
    2013:03:18-09:48:55 gdl-firewall [daemon:err] /usr/local/bin/reporter/admin-reporter.pl[2875]:  Cannot connect: Connection refused
    2013:03:18-09:48:55 gdl-firewall [daemon:err] /usr/local/bin/reporter/pfilter-reporter.pl[2874]:  Cannot connect: Connection refused
    2013:03:18-09:48:55 gdl-firewall [daemon:err] /usr/local/bin/reporter/websec-reporter.pl[2879]:  Cannot connect: Connection refused
    2013:03:18-09:48:56 gdl-firewall [user:notice] rchal:  powersave cpufreq governor could not be loaded
    2013:03:18-09:48:56 gdl-firewall [user:notice] rchal:  userspace cpufreq governor could not be loaded


    Middleware log:

    2013:03:18-09:36:00 gdl-firewall middleware[3848]: T core::Config::Changed:142() => nodes=0 objects=2 triggers=0
    2013:03:18-09:36:00 gdl-firewall middleware[3848]: T core::Config::load:267() => modules=6,4
    2013:03:18-09:36:00 gdl-firewall middleware[3848]: T main::top-level:257() => ending cycle 19, caught 0 signals, 0 children still running
    2013:03:18-09:49:01 gdl-firewall middleware[3851]: T main::top-level:62() => MiddleWare starting
    2013:03:18-09:49:01 gdl-firewall middleware[3851]: T main::top-level:210() => starting cycle 0, caught 0 signals
    2013:03:18-09:49:01 gdl-firewall middleware[3851]: T core::Config::Changed:132() => configversion=0


    Service Monitor Log:

    2013:03:18-09:28:53 gdl-firewall service_monitor[4653]: id="4000" severity="info" sys="System" sub="loadbalancing" name="Set Availability Group REF_NetAvaGdldirecto to 192.168.42.130"
    2013:03:18-09:28:55 gdl-firewall service_monitor[4653]: id="4000" severity="info" sys="System" sub="loadbalancing" name="REF_NetAvaUnosqDnsForwa ICMP 172.16.16.2 changed state to ONLINE"
    2013:03:18-09:28:55 gdl-firewall service_monitor[4653]: id="4000" severity="info" sys="System" sub="loadbalancing" name="Set Availability Group REF_NetAvaUnosqDnsForwa to 172.16.16.2"
    2013:03:18-09:28:55 gdl-firewall service_monitor[4653]: id="4000" severity="info" sys="System" sub="loadbalancing" name="REF_NetAvaGdldirecto ICMP 172.16.16.2 changed state to ONLINE"
    2013:03:18-09:28:55 gdl-firewall service_monitor[4653]: id="4000" severity="info" sys="System" sub="loadbalancing" name="Set Availability Group REF_NetAvaGdldirecto to 172.16.16.2"
    2013:03:18-09:49:06 gdl-firewall service_monitor[4657]: id="4000" severity="info" sys="System" sub="loadbalancing" name="Starting real server checker with 21 threads"
    2013:03:18-09:49:06 gdl-firewall service_monitor[4657]: id="4002" severity="info" sys="System" sub="loadbalancing" name="Open ICMPv4 socket"
    2013:03:18-09:49:06 gdl-firewall service_monitor[4657]: id="4002" severity="info" sys="System" sub="loadbalancing" name="Open ICMPv6 socket"
Reply
  • 1. NUMA config is good. All of the other VMs run without a problem
    2. I don't think Linux supports dynamic memory so I never enable it for Linux VMs
    3. I see the exact same bahavior on a physical machine (current setup)
    4. The logs have nothing. Here's an extract:

    boot log:

    2013:03:18-09:48:53 gdl-firewall kernel: [    6.276929] EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: discard
    2013:03:18-09:48:53 gdl-firewall kernel: [    6.290687] EXT4-fs (sda5): mounted filesystem with ordered data mode. Opts: discard
    2013:03:18-09:48:53 gdl-firewall kernel: [    6.307816] EXT4-fs (sda7): mounted filesystem with ordered data mode. Opts: discard
    2013:03:18-09:48:53 gdl-firewall kernel: [    6.319771] EXT4-fs (sda8): mounted filesystem with ordered data mode. Opts: discard
    2013:03:18-09:48:53 gdl-firewall kernel: [    6.824933] RED: starting, Copyright (c) 2009 Sven Schnelle 
    2013:03:18-09:48:55 gdl-firewall syslog-ng[2763]: Termination requested via signal, terminating;
    2013:03:18-09:48:55 gdl-firewall syslog-ng[2763]: syslog-ng shutting down; version='3.0.10'
    2013:03:18-09:52:56 gdl-firewall kernel: [    0.000000] Linux version 3.3.8-74.g487ae8c-smp (abuild@axgbuild) (gcc version 4.3.4 [gcc-4_3-branch revision 152973] (SUSE Linux) ) #1 SMP Mon Jan 21 14:28:45 UTC 2013
    2013:03:18-09:52:56 gdl-firewall kernel: [    0.000000] BIOS-provided physical RAM map:
    2013:03:18-09:52:56 gdl-firewall kernel: [    0.000000]  BIOS-e820: 0000000000000000 - 000000000009ec00 (usable)
    2013:03:18-09:52:56 gdl-firewall kernel: [    0.000000]  BIOS-e820: 000000000009ec00 - 00000000000a0000 (reserved)


    Fallback log:

    2013:03:18-09:32:42 gdl-firewall [daemon[:D]ebug] rrdcached[3629]:  rotating journals
    2013:03:18-09:32:42 gdl-firewall [daemon[:D]ebug] rrdcached[3629]:  started new journal /var/log/reporting/rrd/rrd.journal.1363620762.335447
    2013:03:18-09:32:42 gdl-firewall [daemon[:D]ebug] rrdcached[3629]:  removing old journal /var/log/reporting/rrd/rrd.journal.1363613562.335442
    2013:03:18-09:35:58 gdl-firewall [daemon:info] irqd[3190]:  ppp1 ppp  
    2013:03:18-09:36:00 gdl-firewall [daemon:info] irqd[3190]:  ppp1 ppp  
    2013:03:18-09:48:55 gdl-firewall [daemon:info] acpid:  starting up
    2013:03:18-09:48:55 gdl-firewall [daemon:info] acpid:  1 rule loaded
    2013:03:18-09:48:55 gdl-firewall [daemon:info] acpid:  waiting for events: event logging is off
    2013:03:18-09:48:55 gdl-firewall [daemon:err] /usr/local/bin/reporter/admin-reporter.pl[2875]:  Cannot connect: Connection refused
    2013:03:18-09:48:55 gdl-firewall [daemon:err] /usr/local/bin/reporter/pfilter-reporter.pl[2874]:  Cannot connect: Connection refused
    2013:03:18-09:48:55 gdl-firewall [daemon:err] /usr/local/bin/reporter/websec-reporter.pl[2879]:  Cannot connect: Connection refused
    2013:03:18-09:48:56 gdl-firewall [user:notice] rchal:  powersave cpufreq governor could not be loaded
    2013:03:18-09:48:56 gdl-firewall [user:notice] rchal:  userspace cpufreq governor could not be loaded


    Middleware log:

    2013:03:18-09:36:00 gdl-firewall middleware[3848]: T core::Config::Changed:142() => nodes=0 objects=2 triggers=0
    2013:03:18-09:36:00 gdl-firewall middleware[3848]: T core::Config::load:267() => modules=6,4
    2013:03:18-09:36:00 gdl-firewall middleware[3848]: T main::top-level:257() => ending cycle 19, caught 0 signals, 0 children still running
    2013:03:18-09:49:01 gdl-firewall middleware[3851]: T main::top-level:62() => MiddleWare starting
    2013:03:18-09:49:01 gdl-firewall middleware[3851]: T main::top-level:210() => starting cycle 0, caught 0 signals
    2013:03:18-09:49:01 gdl-firewall middleware[3851]: T core::Config::Changed:132() => configversion=0


    Service Monitor Log:

    2013:03:18-09:28:53 gdl-firewall service_monitor[4653]: id="4000" severity="info" sys="System" sub="loadbalancing" name="Set Availability Group REF_NetAvaGdldirecto to 192.168.42.130"
    2013:03:18-09:28:55 gdl-firewall service_monitor[4653]: id="4000" severity="info" sys="System" sub="loadbalancing" name="REF_NetAvaUnosqDnsForwa ICMP 172.16.16.2 changed state to ONLINE"
    2013:03:18-09:28:55 gdl-firewall service_monitor[4653]: id="4000" severity="info" sys="System" sub="loadbalancing" name="Set Availability Group REF_NetAvaUnosqDnsForwa to 172.16.16.2"
    2013:03:18-09:28:55 gdl-firewall service_monitor[4653]: id="4000" severity="info" sys="System" sub="loadbalancing" name="REF_NetAvaGdldirecto ICMP 172.16.16.2 changed state to ONLINE"
    2013:03:18-09:28:55 gdl-firewall service_monitor[4653]: id="4000" severity="info" sys="System" sub="loadbalancing" name="Set Availability Group REF_NetAvaGdldirecto to 172.16.16.2"
    2013:03:18-09:49:06 gdl-firewall service_monitor[4657]: id="4000" severity="info" sys="System" sub="loadbalancing" name="Starting real server checker with 21 threads"
    2013:03:18-09:49:06 gdl-firewall service_monitor[4657]: id="4002" severity="info" sys="System" sub="loadbalancing" name="Open ICMPv4 socket"
    2013:03:18-09:49:06 gdl-firewall service_monitor[4657]: id="4002" severity="info" sys="System" sub="loadbalancing" name="Open ICMPv6 socket"
Children
No Data