Здравствуйте.
В компании строю и ввожу в эксплуатацию новую сеть. Установлены 2 маршрутизирующих коммутатора уровня ядра/агрегации (серии HP A5500), второй из которых в связи с переносом шкафа временно отключен.
В 4-х функционирующих телекоммуникационных шкафах на уровне доступа установлены коммутаторы: гигабитные серии DGS-1210-ХХ/ME rev A1 (по 2-3 шт.) и PoE коммутаторы под телефонию и видеонаблюдение DES-1210-28P rev B1 (по 2-6 шт), прошивки разных версий (актуальных на момент ввода в эксплуатацию стоек).
В сети внедрен RSTP для обеспечения отказоустойчивости. Вся эта конструкция работает уже более полугода, проблем из-за RSTP ни при работе 2-х коммутаторов ядра, ни после отключения второго - нет.
Параметры RSTP - стандартные, время Hello и прочих параметров в настройках коммутаторов HP и DLink одинаковые (оставлены по умолчанию).
В данный момент ввожу в эксплуатацию 5-ый телекоммуникационный шкаф, в котором установлены 2 шт. DGS-1210-52/ME rev A1 и 6 шт.
DES-1210-28P "новой" ревизии
C1.
Схема подключения оборудования (
рисунок 1) - фактически типовая для всех 5 шкафов, коммутатор CoreSw2 на данный момент отсутствует.
Вложение:
01 схема стойки.png [ 16.39 KiB | Просмотров: 3182 ]
К коммутаторам в общей сложности подключено сейчас около 40 компьютеров, 40 телефонов и 5 видеокамер.
Конфигурация всех коммутаторов достаточно типовая и простая: несколько vlan-ов, BPDU protection и Loopback detection на "юзерских" портах, RSTP со стандартными настройками на аплинках.
Первый маршрутизирующий коммутатор является STP Root.
С периодичностью в несколько дней уже в третий раз наблюдаю "отвал" одного или нескольких коммутаторов в конце цепочки. Последний раз (сегодня) отвалился один коммутатор PoeSw6.
При этом порт, к которому он подключен (PoeSw5 порт 28) ушел в статус Blocking (
рисунок 2). Отключив STP для этого порта коммутатор PoeSw6 вновь стал доступен.
Вложение:
02 блокировка порта.png [ 58.08 KiB | Просмотров: 3182 ]
В логах коммутатора PoeSw5 многократно повторяется событие (
рисунок 3) с момента возникновения проблемы до момента отключения STP.
В логах коммутатора PoeSw6 после восстановления доступа к нему увидел событие (
рисунок 3), указанный MAC принадлежит самому коммутатору PoeSw6.
Вложение:
03 логи PoeSw5 и PoeSw6.png [ 86.44 KiB | Просмотров: 3182 ]
Также спустя некоторое время (после отключения STP на PoeSw5) возникла проблема с входом на PoeSw6 через веб-интерфейс (сообщение браузера "Соединение было сброшено" или ошибка "Error Observed Error: 400 Bad Request" 2-3 секунд задержки) и telnet (выводится приглашение на ввод логина, ввести логин не удается, через некоторое время соединение отваливается по тайм-ауту).
После нескольких попыток поочередно подключиться через веб и telnet управление вновь стало доступно, коммутатор не перезагружался, в логах никаких событий.
Не знаю точно, есть ли взаимосвязь между этой проблемой и проблемой с STP.
На данный момент на GigSw1, GigSw2 установлена прошивка 6.12.B004, на PoeSw1 - PoeSw3 - 4.10.004, PoeSe4 - PoeSw6 - была 4.10.004, после первого сбоя 2 недели назад обновил до 4.10.B014.
Более подробная информация об "отвалившемся" коммутаторе:
Код:
DES-1210-28P> show switch
System name : Rack05-PoeSw6
System Contact :
System Location : 3 Floor
System up time : 17 days, 21 hrs, 53 min, 42 secs
System Time : 29/04/2016 15:10:19
System hardware version : C1
System firmware version : 4.10.B014
System boot version : 1.00.012
System serial number : QB3L4F8001515
MAC Address : 6C-72-20-B7-3A-20