Добрый день.
За две недели два раза столкнулись с пренеприятнейшей проблемой на DGS-3627G на двух разных коммутаторах. Прошивка 2.84-B25. Настройки похожи, L2+QinQ, vlan_translation, несколько ipif'ов (не много, 3-7 штук, все /30 либо /29, управление /24), включен PIM, IGMP Snooping. В основном нагрузка - L2 (сквозь него ходит PPPoE, заворачиваемый в QinQ).
Суть в следующем:
Случай 1.
Коммутатор внезапно пропадает по управлению. L2-трафик через него бегает, никаких проблем нет. L3 через него не ходит вообще. На ARP не отвечает.
По приезду на место выясняем, что перегрузки проца нет, делаем clear fdb / clear arp / disable pim и прочие радости с disable, даже для уверенности пересоздаем ipif'ы - не помогает.
Перезагружаем железку - всё начинает работать.
Случай 2. На коммутаторе OSPF.
Коммутатор аналогично внезапно пропадает. L2-трафик бегает без проблем, управление недоступно полностью.
L3 - ходит, но как-то кусочно, т.е. на проходящей через коммутатор телефонии голос "рваный" блоками по 1-2 секунды. Пинги сквозь коммутатор идут через раз. На ARP - отвечает. OSPF - работает, но как-то странно, каждые ~40 секунд наблюдаем такие логи на соседе:
Код:
Dec * *:59:39: %OSPF-5-ADJCHG: Process 1, Nbr *.*.*.7 on Vlan* from LOADING to FULL, Loading Done
Dec * *:00:20: %OSPF-5-ADJCHG: Process 1, Nbr *.*.*.7 on Vlan* from LOADING to FULL, Loading Done
Dec * *:01:01: %OSPF-5-ADJCHG: Process 1, Nbr *.*.*.7 on Vlan* from LOADING to FULL, Loading Done
Dec * *:01:42: %OSPF-5-ADJCHG: Process 1, Nbr *.*.*.7 on Vlan* from LOADING to FULL, Loading Done
Dec * *:02:23: %OSPF-5-ADJCHG: Process 1, Nbr *.*.*.7 on Vlan* from LOADING to FULL, Loading Done
Dec * *:03:04: %OSPF-5-ADJCHG: Process 1, Nbr *.*.*.7 on Vlan* from LOADING to FULL, Loading Done
Dec * *:03:45: %OSPF-5-ADJCHG: Process 1, Nbr *.*.*.7 on Vlan* from LOADING to FULL, Loading Done
Dec * *:04:26: %OSPF-5-ADJCHG: Process 1, Nbr *.*.*.7 on Vlan* from LOADING to FULL, Loading Done
Dec * *:05:07: %OSPF-5-ADJCHG: Process 1, Nbr *.*.*.7 on Vlan* from LOADING to FULL, Loading Done
Dec * *:05:49: %OSPF-5-ADJCHG: Process 1, Nbr *.*.*.7 on Vlan* from LOADING to FULL, Loading Done
При этом каждый раз приходят несколько разные наборы сетей, то одной нет, то другой.
Ничего, кроме перезагрузки, не помогает.