Здравствуйте.
Вот не сколько месяцев не могу уловит проблему. Пару раз в день пропадает трафик на нескольком минут, в разное время. Просто все замирает и ходят только арп запросы. С определенных портов, проблема почти только на тех портах, куда включен OLT BDCOM (PON)
На агрегации стоит Dlink DGS-3120 в стеке с 3 штук. Он пакует QinQ вланы.
В длинк включен БРАС 4 карточками и настроен link_aggregation
Тоесть например. Если в длинк включен узел с OLT или просто напрямую OLT, то проблема появляется на всех устройствах которые подключены к данному S-vlan на порту. Там где нет OLTов, проблем тоже нет. Уже от фонаря пробовал на свичах включать/отключать dhcp-snooping, arp-inspection ip verify source, фильтры dhcp и т.д. Никакой реакции. В лог ничего не сыпет.
Может олты посылают какие-то кривые пакеты?
Схемку с проведением теста для наглядности прилепил. Для теста назначил статический IP(10.0.0.2) на ноуте и БРАСе через QinQ влан(bond0.264.1256, 10.0.0.1).
Так же, на втором сервере создал такой же интерфейс(eth0.264.1256, 10.0.0.3). Через БРАС траф пропал, со 2 сервером все работало.
При отключении HOL на брас идут потери пакетов.
Может ли свич дропать трафик?
При проведении теста, казалось бы что проблема в БРАСе, но может и в свиче, если он ложит указанные порты...
Как еще можно диагностировать и возможно исключить проблему со свичем?
Код:
#show switch
Command: show switch
Device Type : DGS-3120-24SC Gigabit Ethernet Switch
Unit ID : 1
MAC Address : EC-22-80-3C-31-E0
IP Address : 192.168.225.4 (Manual)
VLAN Name : Management
Subnet Mask : 255.255.255.0
Default Gateway : 192.168.225.1
Boot PROM Version : Build 3.00.501
Firmware Version : Build 4.11.R006
Hardware Version : B1
Firmware Type : EI
Serial Number : R3144E7000172
System Name : Aggregation
System Location : Bunker
System Uptime : 36 days, 11 hours, 27 minutes, 26 seconds
System Contact : morfey@hata.net.ua
Spanning Tree : Disabled
GVRP : Disabled
IGMP Snooping : Enabled
MLD Snooping : Disabled
VLAN Trunk : Disabled
Telnet : Enabled (TCP 23)
Web : Disabled
SNMP : Enabled
SSL Status : Disabled
SSH Status : Disabled
802.1X : Disabled
Jumbo Frame : On
CLI Paging : Disabled
MAC Notification : Disabled
Port Mirror : Disabled
SNTP : Enabled
DHCP Relay : Disabled
HOL Prevention State : Enabled
Syslog Global State : Enabled
Single IP Management : Disabled
Password Encryption Status : Disabled
DNS Resolver : Disabled
Код:
#show utilization cpu
Command: show utilization cpu
CPU Utilization
-------------------------------------------------------------------------------
Five seconds - 65 % One minute - 66 % Five minutes - 65 %
Проблемные порты в основном 2:2, 2:8, 3:4
Код:
#show utilization ports
Command: show utilization ports
Port TX/sec RX/sec Util Port TX/sec RX/sec Util
----- ---------- ---------- ---- ----- ---------- ---------- ----
1:1 42908 63367 39 1:21 190 428 1
1:2 46007 63383 39 1:22 560 375 1
1:3 43095 63392 39 1:23 3082 2015 2
1:4 40645 63371 39 1:24 1491 997 1
1:5 19 8 1 2:1 36 44 1
1:6 27767 40485 26 2:2 29113 19873 18
1:7 0 0 1 2:3 3192 4807 3
1:8 68257 49085 43 2:4 23 25 1
1:9 889 505 1 2:5 6014 5687 5
1:10 8640 6891 5 2:6 5025 2962 3
1:11 579 223 1 2:7 401 286 1
1:12 630 481 1 2:8 66600 46359 41
1:13 664 514 1 2:9 1138 835 1
1:14 1401 1424 1 2:10 120 96 1
1:15 2826 1266 2 2:11 3114 1762 2
1:16 36913 28028 23 2:12 356 213 1
1:17 1150 704 1 2:13 457 334 1
1:18 3205 2113 2 2:14 1449 877 1
1:19 1425 913 1 2:15 3174 2572 2
1:20 2675 2109 2 2:16 3009 2142 2
2:17 773 595 1 3:13 1408 718 1
2:18 194 164 1 3:14 1145 743 1
2:19 1374 1003 1 3:15 577 418 1
2:20 968 634 1 3:16 12868 8769 8
2:21 618 325 1 3:17 0 0 0
2:22 354 173 1 3:18 0 0 0
2:23 1177 3685 2 3:19 0 0 0
2:24 8471 5167 5 3:20 0 0 0
3:1 0 0 0 3:21 0 0 0
3:2 0 0 0 3:22 669 416 1
3:3 0 0 0 3:23 2096 1191 1
3:4 22019 18374 14 3:24 0 0 0
3:5 0 0 0
3:6 0 0 0
3:7 8 7 1
3:8 5984 28335 19
3:9 95 24 1
3:10 591 611 1
3:11 0 0 0
3:12 2892 2 2
Полный конфиг свича
https://pastebin.com/X58pnrafБуду благодарен за любую помощь!