A partire dalla release 13.2 VOS ha offerto la possibilità di configurare un'interfaccia IP a tolleranza di errore configurando adattatori Ethernet attivi/standby. All'adattatore attivo viene assegnato un indirizzo MAC Ethernet e allo standby un altro indirizzo MAC. Se l'adattatore attivo fallisce, lo standby viene resettato per utilizzare l'indirizzo MAC attivo e diventa l'adattatore attivo. Quando l'adattatore attivo precedente torna in servizio assume il ruolo dell'adattatore standby, compreso il suo indirizzo MAC. Gli host remoti che comunicano con il modulo attraverso l'interfaccia IP vedono, nel peggiore dei casi, un ritardo di circa un secondo durante la transizione.
Il problema è che non è sufficiente configurare VOS, anche gli switch di rete a cui si collegano gli adattatori di standby e attivi devono essere configurati correttamente. Questo di solito non è un problema quando la partnership attiva/standby è configurata per la prima volta, ma nel tempo è possibile che la configurazione dello switch muti in modi che non danneggiano le comunicazioni attuali, ma impediscono un guasto senza soluzione di continuità quando VOS cambia lo stato dell'adattatore di standby in attivo.
Ci sono 3 modi per scoprire che queste mutazioni della configurazione degli interruttori si sono verificate.
Il primo è quando l'adattatore attivo si guasta e VOS commuta lo stato dell'adattatore di standby su attivo. A questo punto gli host remoti non possono più comunicare con il modulo attraverso quell'interfaccia e si ha un adattatore guasto. Ho visto questa situazione molte volte - non è bello.
Il secondo modo è quello di rivedere la configurazione dell'interruttore. Questo comporta che l'amministratore di rete esamini una configurazione funzionante alla ricerca di qualcosa che potrebbe causare un problema - buona fortuna.
Il terzo è quello di testare. Si può usare il comando dlmux_admin per forzare un fail over o su qualche hardware si può fisicamente estrarre l'adattatore dal modulo o usare un comando VOS per disabilitare l'adattatore ma io preferisco semplicemente scollegare l'adattatore attivo dalla rete. Se avete una connessione attiva al modulo già stabilita dovreste essere in grado di dire in pochi secondi se il fail over è stato senza soluzione di continuità o meno. Facendo questo in un momento a vostra scelta potete scegliere un momento in cui sarà meno dirompente se il fail over non è senza soluzione di continuità. Inoltre, poiché l'adattatore è ancora in funzione, il recupero è semplice, ricollegare il cavo e scollegare l'adattatore appena attivo, attendere l'altro fail over e poi ricollegare l'adattatore ora in standby.
Se il test dimostra che il fail over non è senza soluzione di continuità, si ha il lusso di lavorare con l'amministratore di rete su un problema dimostrato senza che nessuno chieda di sapere quanto tempo ci vorrà prima che venga risolto. Se il test è stato senza soluzione di continuità, siete a posto. Come suggerisce il titolo di questo blog, consiglio di effettuare i test periodicamente, diciamo il primo lunedì del mese.