Добрый день! Проблема очень давно, и решение найти никак не получается... В ядре сети - NEXUS, от него звездой узлы сети DGS 3120-24SC по районам. От каждого узла сформированы кольца из DGS 3200-10/16, DGS 1210-20ME, DGS 3000-20L, DGS 3000-10TC в пределах 10 свитчей в кольце. DGS 3120-24SC всегда root, дальнейшие настройки RSTP классические, кольца в обычном режиме рвутся посередине. Проблема - после массовых отключений электричества случается, что один из свитчей в кольце зависает/недогружается/тупеет и начинает вредоносить - теряем доступ как к управлению свитчами, так и абонентов (управление свитчами и абоненты разделены вланами на каждом узле). Причем данная "помеха" проходит через NEXUS и влияет и на другие узлы сети. В логах NEXUS: N3064-int %L2FM-2-L2FM_MAC_FLAP_DISABLE_LEARN_N3K: Loops detected in the network for mac 00a0.54c3.3983 among ports Po3 and Po6 vlan 52 - Disabling dynamic learning notifications for a period between 120 and 240 seconds on vlan 52.
В логах узловых свитчей: Index Time Level Log Text 78463 2024-01-09 03:50:00 NOTI(5) Spanning Tree port status change (Instance:0, Port:20) Forwarding->Discarding 78462 2024-01-09 03:50:00 NOTI(5) Spanning Tree port status change (Instance:0, Port:19) Forwarding->Discarding 78461 2024-01-09 03:50:00 NOTI(5) Spanning Tree port status change (Instance:0, Port:17) Forwarding->Discarding 78460 2024-01-09 03:50:00 NOTI(5) Spanning Tree port status change (Instance:0, Port:14) Forwarding->Discarding 78459 2024-01-09 03:50:00 NOTI(5) Topology changed (Instance:0, Port:17,MAC:80-26-89-B9-C7-48) 78458 2024-01-09 03:50:00 NOTI(5) Topology changed (Instance:0, Port:15,MAC:3C-1E-04-13-3E-50) 78457 2024-01-09 03:50:00 NOTI(5) Spanning Tree port status change (Instance:0, Port:15) Learning->Forwarding 78456 2024-01-09 03:50:00 NOTI(5) Spanning Tree port status change (Instance:0, Port:15) Discarding->Learning 78455 2024-01-09 03:50:00 NOTI(5) Spanning Tree port status change (Instance:0, Port:15) Forwarding->Discarding 78454 2024-01-09 03:50:00 NOTI(5) Spanning Tree port status change (Instance:0, Port:10) Learning->Forwarding
И такая ситуация до тех пор, пока или не пробьемся удаленно на узел, в редкие моменты когда он доступен (telnet, snmp), или едем на место и вручную рвем все кольца, тогда сеть восстанавливается, по одному замыкаем, вычисляем проблемное кольцо, оставляем его порванным на узле - не работает только часть дерева от узлового свитча до зависшего свитча, идем к зависшему свитчу, или перезагружаем, или меняем. Стенд в офисе собирали, сымитировать такую ситуацию не получилось. Собственно вопрос - какие механизмы защиты можно включить на узловых и кольцевых коммутаторах для защиты от таких ситуаций.
|