This discussion has been locked.
You can no longer post new replies to this discussion. If you have a question you can start a new discussion

Access to internet fails; hard reset fixes for x hours

Have had an ASG running for over a year now. Running 7.201. Starting about 10 days ago, internet connectivity would go down. Could ping inside network and the ASG box. A hard reset on the ASG box would fix the issue. Downloaded and installed 7.200 on a different box, restored older, compatible backup. Would work again for several hours then stop. Re-installed and restored again, not allowing Up2date to install 7.201 but still have same problem. Have swapped it out for a router and I have been up for over 2 days. So it seems to NOT be my ISP, NOT be the hardware. That leaves ASG software? System log seems to have no entries indicating a problem, though I could be missing something. 
Any suggestions? I've gotten used to ASG just working.


This thread was automatically locked due to age.
Parents
  • Who's the ISP, and what kind of connection? PPPoE, DHCP, ... ?

    You might want to ask the ISP if they changed anything, and tell them what's happening.

    Barry
  • BarryG,
    InsightBB is the ISP. Cable service via DHCP. 
    They're not the best, but I haven't had the issue when I replace my ASG box with a router.
  • Can you SSH to the Astaro when it locks up?  Checking iftop might show if you have a bandwidth saturation problem, top might show a process hogging CPU and/or RAM.

    Also, if you are using the HTTP proxy make sure the exception for adobe.com is enabled.
  • Check the DHCP client logs on Astaro, and or the lease.
    Maybe it's expiring and not renewing correctly, due to a change by the ISP.

    Barry
  • Thanks for the tips Jack. It's been up for over 50 hours (knock on silicon) but I'll try those if / when it fails again.
  • Barry,
    Thanks, I'm not sure if there's a specific log for the DHCP client (is there?) but the System Messages logs has numerous DHCP entries, one each minute, most likely since it's communicating with DynDNS. For example:
    2008:07:23-02:10:38 (none) dhcpc-sh: DHCP connection fine. Checking again in 60 seconds
    2008:07:23-02:11:38 (none) dhcpc-sh: DHCP connection fine. Checking again in 60 seconds
    2008:07:23-02:12:38 (none) dhcpc-sh: DHCP connection fine. Checking again in 60 seconds

    I find no DHCP discover-offer, etc. handshake in my log, though I just noticed that my log is reset at midnight daily though in Log Settings it's set to "Never delete log files." I'll change that to 30 days and see if I can trap something there, too. Dashboard shows Uptime: 2d 2h 39m so I'll have to wait and see when / if it fails again.
  • You should be able to find when the DHCP lease expires by examining 
    /var/sec/chroot-dhcpc/var/lib/dhcpcd/dhcpcd-eth0.info

    mine looks like this:

    IPADDR=1.2.3.4
    NETMASK=255.255.248.0
    NETWORK=1.2.2.0
    BROADCAST=255.255.255.255
    GATEWAY=1.2.2.1
    DOMAIN='socal.rr.com'
    DNS=66.75.160.63,66.75.160.64
    DHCPSID=66.75.176.25
    DHCPGIADDR=10.237.32.1
    DHCPSIADDR=0.0.0.0
    DHCPCHADDR=00:A0:C9:B8:8B:48
    DHCPSHADDR=00:01:5C:23:FA:02
    DHCPSNAME=''
    LEASETIME=86400
    RENEWALTIME=43200
    REBINDTIME=75600
    INTERFACE='eth0'
    CLASSID='Linux 2.6.16.60-73-default i686'
    CLIENTID=00:A0:C9:B8:8B:48

    You probably need to compare the renewal, lease, and rebind time with the mod date on the file
    -rw-r--r-- 1 root root 428 Jun 20 23:58 dhcpcd-eth0.info

    The renewal/lease/rebind times are in seconds from the last renewal.

    My lease is one day, and I'm guessing the renewal time, 12 hours, in when Astaro will try to renew the lease, so mine should try to renew every 12 hours, at 11:58 and 23:58.

    It might be a good idea to leave a sniffer running, capturing all dhcp traffic.

    tcpdump is available in Astaro. Make sure you have it log to a partition with lots of space, such as /tmp or /var/storage.

    # df -h
    Filesystem            Size  Used Avail Use% Mounted on
    rootfs                5.3G  1.1G  4.0G  22% /
    udev                  253M   60K  252M   1% /dev
    /dev/disk/by-label/root
                          5.3G  1.1G  4.0G  22% /
    /dev/disk/by-label/boot
                          342M   14M  311M   5% /boot
    /dev/disk/by-label/storage
                          4.3G  493M  3.6G  12% /var/storage
    /dev/disk/by-label/log
                          5.6G  1.6G  3.8G  29% /var/log
    /dev/disk/by-label/tmp
                          688M   92M  561M  15% /tmp


    Barry
  • Filter out the "fine" messages from the log, and you should see something like:

    fw:/var/log # grep -i dhcp system.log|grep -v fine
    2008:07:23-02:17:11 (none) dhcpcd[3466]: sending DHCP_REQUEST for 1.2.3.4 to 66.75.176.25
    2008:07:23-08:49:51 (none) dhcpcd[3466]: broadcasting DHCP_REQUEST for 1.2.3.4
    2008:07:23-08:49:51 (none) dhcpcd[3466]: dhcpIPaddrLeaseTime=62839 in DHCP server response.
    2008:07:23-08:49:51 (none) dhcpcd[3466]: dhcpT1value is missing in DHCP server response. Assuming 31419 sec
    2008:07:23-08:49:51 (none) dhcpcd[3466]: dhcpT2value is missing in DHCP server response. Assuming 54984 sec
    2008:07:23-08:49:51 (none) dhcpcd[3466]: DHCP_ACK received from  (66.75.176.25)
    2008:07:23-17:33:30 (none) dhcpcd[3466]: sending DHCP_REQUEST for 1.2.3.4 to 66.75.176.25

    The times aren't quite what I expected, but the info is there.

    Barry
Reply
  • Filter out the "fine" messages from the log, and you should see something like:

    fw:/var/log # grep -i dhcp system.log|grep -v fine
    2008:07:23-02:17:11 (none) dhcpcd[3466]: sending DHCP_REQUEST for 1.2.3.4 to 66.75.176.25
    2008:07:23-08:49:51 (none) dhcpcd[3466]: broadcasting DHCP_REQUEST for 1.2.3.4
    2008:07:23-08:49:51 (none) dhcpcd[3466]: dhcpIPaddrLeaseTime=62839 in DHCP server response.
    2008:07:23-08:49:51 (none) dhcpcd[3466]: dhcpT1value is missing in DHCP server response. Assuming 31419 sec
    2008:07:23-08:49:51 (none) dhcpcd[3466]: dhcpT2value is missing in DHCP server response. Assuming 54984 sec
    2008:07:23-08:49:51 (none) dhcpcd[3466]: DHCP_ACK received from  (66.75.176.25)
    2008:07:23-17:33:30 (none) dhcpcd[3466]: sending DHCP_REQUEST for 1.2.3.4 to 66.75.176.25

    The times aren't quite what I expected, but the info is there.

    Barry
Children