Alta disponibilidade (HA) refere-se ao objetivo de manter um sistema ou aplicação operacional e disponível para os usuários em uma porcentagem muito alta de tempo, minimizando o tempo de inatividade (downtime) planejado e não planejado.
Na instituição que trabalho estou enfrentando algo inusitado, temos duas instancias EC2 (AWS) em mirror e durante algum tempo em funcionamento a instância primaria nos lança um erro no message.log dizendo o seguinte (Journal Daemon has been inactive with I/O pending for 10 seconds) e em seguida efetua o chaveamento de máquina para o nó 2 da configuração, isso esta ocorrendo com uma frequência grande impactando a operação.
A infra diz que o link está com 50% de carga e em teoria não há gargalo na comunicação.