A partir da versão 13.2, o VOS ofereceu a capacidade de configurar uma interface IP tolerante a falhas através da configuração de adaptadores Ethernet ativos/standby. O adaptador ativo recebe um endereço MAC Ethernet e o de espera recebe outro. Se o adaptador ativo falhar, o standby é reinicializado para usar o endereço MAC ativo e se torna o adaptador ativo. Quando o adaptador ativo anterior volta ao serviço, ele assume o papel do adaptador de standby, incluindo seu endereço MAC. Os hosts remotos que se comunicam com o módulo através da interface IP vêem, na pior das hipóteses, um atraso de um segundo ou mais durante a transição.
O problema é que não basta configurar o VOS, os comutadores de rede que os adaptadores de espera e ativos conectam também devem ser configurados corretamente. Isto normalmente não é um problema quando a parceria ativo/em espera é configurada pela primeira vez, mas com o tempo é possível que a configuração do switch mude de forma que não prejudique as comunicações atuais, mas impeça uma falha contínua quando o VOS muda o estado do adaptador em espera para ativo.
Há 3 maneiras de descobrir que estas mutações de configuração de comutadores ocorreram.
O primeiro é quando o adaptador ativo falha e o VOS muda o estado do adaptador de espera para ativo. Neste ponto, os hosts remotos não podem mais se comunicar com o módulo através dessa interface e você tem um adaptador com falha. Eu já vi esta situação muitas vezes - não é bonita.
A segunda maneira é rever a configuração da chave. Isto envolve fazer com que o administrador da rede reveja uma configuração funcional procurando por algo que possa causar um problema - boa sorte.
A terceira é a de testar. Você pode usar o comando dlmux_admin para forçar uma falha ou em algum hardware você pode puxar fisicamente o adaptador do módulo ou usar um comando VOS para desativar o adaptador, mas prefiro apenas desconectar o adaptador ativo da rede. Se você tiver uma conexão ativa com o módulo já estabelecido, você deverá ser capaz de dizer em segundos se o fail over foi perfeito ou não. Ao fazer isso em um momento de sua escolha, você pode escolher um momento em que será menos perturbador se o fail over não for sem interrupção. Também como o adaptador ainda está funcionando, a recuperação é simples, conecte o cabo de volta e desconecte o novo adaptador ativo, aguarde a outra falha e então conecte o adaptador agora em espera de volta.
Se o teste mostrar que a falha não é perfeita, você tem o luxo de trabalhar com o administrador da rede em um problema comprovado sem que ninguém exija saber quanto tempo até que ele seja corrigido. Se o teste foi perfeito, você está pronto. Como o título deste blog sugere, recomendo testar periodicamente, digamos, na primeira segunda-feira do mês.