Neuromancer писал(а):
kosmich писал(а):
перестает отвечать на пинг.
Недавно было процесс(?) TMR# сожрал 50% CPU, другие 50% - sirq
Трафик ходил нормально, пинговалось с большими потерями (похоже как и у Вас), иногда можно было зайти по telnet, набрать top, который запускался там минут через 5, и увидеть 100% CPU.
Коробка с багами:)
В серверной, коммутатор после некоторого времени простоя, если начать его пинговать, пакетов 6-7 морозился, потом начинал отвечать на пинг.
Установили коммутатор в "поле", около 1К маков, вланы, и поведение описанное выше, хотя жалоб на работу основного сервиса нет.
Уточняю, коммутатор периодически не отвечает на пинг.
Например коммутатор некоторое время отвечает на пинг допустим 60 ответов, некоторое время не отвечает например 180 не ответов. Потерь нет, в то время когда коммутатор отвечает на пинг.
Куда копать, что еще Длинку показать ?
UPD: Установка скорости порта 1000Full руками с двух сторон линка, воскресила доступность коммутатора.
Со вчерашнего вечера он доступен без потерь.
Код:
Mem: 93396K used, 17544K free, 0K shrd, 6256K buff, 22976K cached
CPU: 4% usr 0% sys 0% nic 43% idle 0% io 0% irq 52% sirq
Load average: 1.54 2.05 2.14 3/115 391
PID PPID USER STAT VSZ %VSZ %CPU COMMAND
258 251 root S 236m 218% 4% TMR#
390 258 root S 1288 1% 0% /bin/sh -c /usr/bin/top -n1 > /mnt/top
391 390 root R 1288 1% 0% /usr/bin/top -n1
1 0 root S 1212 1% 0% init
251 1 root S 1204 1% 0% {rcS} /bin/sh /etc/init.d/rcS
181 2 root SW 0 0% 0% [spi1]
204 2 root SW 0 0% 0% [mtdblock3]
3 2 root SW 0 0% 0% [ksoftirqd/0]
257 2 root SWN 0 0% 0% [jffs2_gcd_mtd7]
6 2 root SW 0 0% 0% [kworker/u:0]
235 2 root SW 0 0% 0% [kworker/0:1]
5 2 root SW< 0 0% 0% [kworker/0:0H]
9 2 root SW< 0 0% 0% [khelper]
10 2 root SW 0 0% 0% [kdevtmpfs]
11 2 root SW 0 0% 0% [kworker/u:1]
8 2 root SW 0 0% 0% [migration/0]
55 2 root SW< 0 0% 0% [kblockd]
194 2 root SW 0 0% 0% [mtdblock1]
2 0 root SW 0 0% 0% [kthreadd]
53 2 root SW 0 0% 0% [bdi-default]
UPD2:Вот думаю как дальше жить с этим безобразием.
Посмотрю что там с ошибками на 15 и 16 порту.
15 порт
Код:
DGS-1210-20/ME:5# sh err p 15
Command: show error ports 15
Port Number : 15
RX Frames TX Frames
--------- ---------
CRC Error 0 Excessive Deferral 2055
Undersize 0 CRC Error 0
Oversize 0 Late Collision 0
Fragment 0 Excessive Collision 0
Jabber 0 Single Collision 0
Buffer Full Drop 0
VLAN Ingress Drop 881
STP Drop 0
Ага натикало за пару часов ошибок, трафика передается мизерно мало через этот порт, в основном трафик влан управления.
Теперь 16
Код:
DGS-1210-20/ME:5# sh err p 16
Command: show error ports 16
Port Number : 16
RX Frames TX Frames
--------- ---------
CRC Error 0 Excessive Deferral 0
Undersize 0 CRC Error 0
Oversize 0 Late Collision 0
Fragment 0 Excessive Collision 0
Jabber 0 Single Collision 0
Buffer Full Drop 0
VLAN Ingress Drop 0
STP Drop 0
Ошибки на 16 порту начнут расти примерно так же как на 15, если подать на него влан управления.
И коммутатор сказал, прощай доступ, встретимся как нибудь, через некоторое время.
Смотрим есть ли мак адрес 1210-20 на 4 порту 1100-06
Код:
DGS-1100-06/ME:5# show fdb vlanid 2023
Command: show fdb vlanid 2023
VID VLAN Name MAC Address Port Type
---- -------------------------------- ----------------- ---- ---------------
2023 switch 4C-5E-0C-4E-4D-68 5 Dynamic
2023 switch A0-36-9F-A1-9B-20 4 Dynamic
Total Entries : 2
DGS-1100-06/ME:5#
Нет мака
48:EE:0C:72:81:3F, странно, проверим доступность пингом.
Если коммутатор доступен, то неважно с какого айпи 172.20.0.9 или 172.20.0.250 его пинговать.
Пингуется

как такое возможно ?
Код:
DGS-1100-06/ME:5# ping 172.20.0.10
Command: ping 172.20.0.10
Reply Received From :172.20.0.10, TimeTaken : 10 msecs
Reply Received From :172.20.0.10, TimeTaken : 10 msecs
Reply Received From :172.20.0.10, TimeTaken : <1 msecs
Reply Received From :172.20.0.10, TimeTaken : 20 msecs
Reply Received From :172.20.0.10, TimeTaken : <1 msecs
--- 172.20.0.10 Ping Statistics ---
5 Packets Transmitted, 5 Packets Received, 0% Packets Loss
DGS-1100-06/ME:5# show arpentry
Command: show arpentry
ARP Aging Time = 5 (minutes)
Interface IP Address MAC Address Type
------------- --------------- ----------------- ---------------
System 172.20.0.9 c4-12-f5-f2-0c-6c Local
System 172.20.0.10 48-ee-0c-72-81-3f Dynamic
System 172.20.0.250 a0-36-9f-a1-9b-20 Dynamic
Total Entries : 2
Спустя некоторое время картина маслом.
Код:
DGS-1100-06/ME:5# show arpentry
Command: show arpentry
ARP Aging Time = 5 (minutes)
Interface IP Address MAC Address Type
------------- --------------- ----------------- ---------------
System 172.20.0.9 c4-12-f5-f2-0c-6c Local
System 172.20.0.10 00-00-00-00-00-00 Pending
System 172.20.0.250 a0-36-9f-a1-9b-20 Dynamic
Total Entries : 2
DGS-1100-06/ME:5# ping 172.20.0.10
Command: ping 172.20.0.10
Reply Not Received From : 172.20.0.10, Timeout : 5 secs
Reply Not Received From : 172.20.0.10, Timeout : 5 secs
Reply Not Received From : 172.20.0.10, Timeout : 5 secs
Reply Not Received From : 172.20.0.10, Timeout : 5 secs
Reply Not Received From : 172.20.0.10, Timeout : 5 secs
--- 172.20.0.10 Ping Statistics ---
5 Packets Transmitted, 0 Packets Received, 100% Packets Loss
DGS-1100-06/ME:5#