У нас возникла та же самая проблема, только в этот раз - с DGS-3620-28SC.
Прошивки и аппаратные ревизии коммутаторов:
+-------+----+----------+---------------+
| name | hw | fw | model |
+-------+----+----------+---------------+
| DGS1 | A1 | 1.00.040 | DGS-3620-28SC |
| DGS2 | A1 | 1.00.040 | DGS-3620-28SC |
| DGS3 | A1 | 1.00.040 | DGS-3620-28SC |
| DGS4 | A1 | 1.00.040 | DGS-3620-28SC |
| DGS5 | A1 | 1.00.040 | DGS-3620-28SC |
| DGS6 | A1 | 1.00.040 | DGS-3620-28SC |
| DGS7 | A1 | 1.00.035 | DGS-3620-28SC |
| DGS8 | A1 | 1.00.040 | DGS-3620-28SC |
| DGS10 | A1 | 2.00.016 | DGS-3620-28SC |
| DGS11 | A1 | 1.00.040 | DGS-3620-28SC |
+-------+----+----------+---------------+
На коммутаторах включен OSPF, Есть по 3 VLAN'а на каждом (OSPF VLAN к ядру сети, абонентский VLAN с одной /24, Management Vlan для доступа с одной /24).
Мультикаста нет, конфиг (без учетных записей) прикрепляю. Он одинаковый на всех коммутаторах, кроме одного.
За последние 2 дня все DGS'ы перезагружались 4 раза. Syslog говорит в этих случаях такое:
Message from
syslogd@172.16.0.11 at Aug 30 15:34:06 ...
EMER: System re-start reason: CPU exception
Message from
syslogd@172.16.0.10 at Aug 30 15:34:54 ...
EMER: System re-start reason: CPU exception
Message from
syslogd@172.16.0.8 at Aug 30 15:35:48 ...
EMER: System re-start reason: CPU exception
Message from
syslogd@172.16.0.7 at Aug 30 15:36:36 ...
EMER: System re-start reason: CPU exception
Message from
syslogd@172.16.0.6 at Aug 30 15:37:31 ...
EMER: System re-start reason: CPU exception
Message from
syslogd@172.16.0.5 at Aug 30 15:38:16 ...
EMER: System re-start reason: CPU exception
Message from
syslogd@172.16.0.4 at Aug 30 15:39:03 ...
EMER: System re-start reason: CPU exception
Message from
syslogd@172.16.0.3 at Aug 30 15:39:47 ...
EMER: System re-start reason: CPU exception
Message from
syslogd@172.16.0.2 at Aug 30 15:40:40 ...
EMER: System re-start reason: CPU exception
Message from
syslogd@172.16.0.1 at Aug 30 15:41:34 ...
EMER: System re-start reason: CPU exception
Таблица маршрутизации на всех примерно одинаковая:
IP Address/Netmask Gateway Interface Cost Protocol
------------------ --------------- ------------ -------- --------
0.0.0.0/0 172.16.0.254 AREA0 1 Default
10.0.0.0/24 172.16.0.253 AREA0 10000 OSPF
AAA.BBB.CCC.158/32 172.16.0.254 AREA0 1 OSPF
AAA.BBB..200.228/30 172.16.0.254 AREA0 1 OSPF
172.16.0.0/24 0.0.0.0 AREA0 1 Local
172.16.0.251/32 172.16.0.253 AREA0 10000 OSPF
172.16.0.252/32 172.16.0.253 AREA0 10000 OSPF
172.16.0.253/32 172.16.0.253 AREA0 10000 OSPF
172.16.1.0/24 172.16.0.1 AREA0 21 OSPF
172.16.2.0/24 0.0.0.0 MGM-AC 1 Local
172.16.3.0/24 172.16.0.3 AREA0 21 OSPF
172.16.4.0/24 172.16.0.4 AREA0 21 OSPF
172.16.5.0/24 172.16.0.5 AREA0 21 OSPF
172.16.6.0/24 172.16.0.6 AREA0 21 OSPF
172.16.7.0/24 172.16.0.7 AREA0 21 OSPF
172.16.8.0/24 172.16.0.8 AREA0 21 OSPF
172.16.10.0/24 172.16.0.10 AREA0 21 OSPF
172.16.11.0/24 172.16.0.11 AREA0 21 OSPF
172.31.0.1/32 172.16.0.254 AREA0 1 OSPF
172.31.0.2/32 172.16.0.254 AREA0 1 OSPF
172.31.0.4/30 172.16.0.254 AREA0 1 OSPF
172.31.0.8/30 172.16.0.254 AREA0 1 OSPF
172.31.0.12/30 172.16.0.254 AREA0 1 OSPF
XXX.YYY.160.0/20 172.16.0.254 AREA0 1 OSPF
XXX.YYY.160.0/29 172.16.0.254 AREA0 1 OSPF
XXX.YYY.160.4/30 172.16.0.253 AREA0 10000 OSPF
XXX.YYY.160.8/30 172.16.0.254 AREA0 1 OSPF
XXX.YYY.160.10/32 172.16.0.253 AREA0 10000 OSPF
XXX.YYY.160.12/30 172.16.0.254 AREA0 1 OSPF
XXX.YYY.160.16/30 172.16.0.254 AREA0 1 OSPF
XXX.YYY.160.20/30 172.16.0.254 AREA0 1 OSPF
XXX.YYY.160.254/32 172.16.0.254 AREA0 1 OSPF
XXX.YYY.161.252/30 172.16.0.254 AREA0 1 OSPF
XXX.YYY.162.0/24 172.16.0.1 AREA0 21 OSPF
XXX.YYY.163.0/24 0.0.0.0 INTERNET2 1 Local
XXX.YYY.164.0/24 172.16.0.3 AREA0 21 OSPF
XXX.YYY.165.0/24 172.16.0.4 AREA0 21 OSPF
XXX.YYY.166.0/24 172.16.0.5 AREA0 21 OSPF
XXX.YYY.167.0/24 172.16.0.6 AREA0 21 OSPF
XXX.YYY.168.0/24 172.16.0.7 AREA0 21 OSPF
XXX.YYY.169.0/24 172.16.0.8 AREA0 21 OSPF
XXX.YYY.171.0/24 172.16.0.10 AREA0 21 OSPF
XXX.YYY.172.0/24 172.16.0.11 AREA0 21 OSPF
Total Entries: 43
Физически все коммутаторы подключены в железку Juniper MX5.
Судя по данным мониторинга, средняя загрузка CPU не превышает 20%. Складывается впечатление, что всему виной какой-нибудь непонятный DGS'ам LSA в OSPF со стороны Juniper, или что-нибудь вроде того, т.к. помимо OSPF эти железки ничего не объединяет.
Климатические и электрические внешние факторы исключены - железки очень сильно разнесены географически, две из них стоят на техплощадке с гарантированно хорошими условиями кондиционирования и электропитания.
Куда копать, что искать?