Artem Kolpakov писал(а):
Планируемая дата выхода фикса ситуации с cable_diag - первые числа ноября.
По поводу подвисаний.
Исходя из присланной информации - загрузка cpu небольшая, чего-то сверхъестественного в конфиге тоже нет. Правда, один вопрос, почему на, казалось бы, коммутаторе доступа все порты прописаны как тегированые в каждом vlan? Или это такой мини-агрегатор?
Не совпадают ли моменты "зависания" с моментом опроса коммутаторов по SNMP? Если вы опрашиваете все дерево - это серьезно загрузит cpu и в этот момент коммутатор не будет откликаться на telnet и icmp.
Именно этот коммутатор стоит в серверной, к нему подключен резервный канал, мониторинговый сервер и SIP устройства .
Загрузка CPU не является причиной, как вы уже подметили.
Вы наверно не правильно поняли, пропадание управление происходит таким образом:
Перезагрузка по питанию или просто перезагрузка с консольного кабеля - коммутатор "оживает"
от 10 минут до 2х дней он может работать стабильно.
Потом на неделю виснет иногда на меньше.
Снова подымается сам по себе, если не нужно было на него зайти раньше, и он не был перезагружен по питанию.
Вы по всей видимости не достаточно оценили масштаб проблемы, из 40 свитчей 3200, приблизительно 10 постоянно не доступны. Если б проблема была с одним из них, плюнул бы, заменил бы даже не думая.
Заметил еще такую штуку, если перегрузить один из коммутаторов рядом стоящих к зависнувшему, зависнувший коммутатор может "ожить" через пару минут.
Собираем статистику по SNMP, специально на пару дней отключал опросы по SNMP, оставлял только ping. Те же яйца только в профиль.
Грешил на скачки напряжения. Провел анализ бесперебойников, ни производитель, ни уровень разряда/заряда на "зависания" коммутатора не влияет.