Projetando sistemas distribuídos de alta disponibilidade em AWS - Disponibilidade e muito mais: entendendo e melhorando a resiliência de sistemas distribuídos em AWS

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Projetando sistemas distribuídos de alta disponibilidade em AWS

As seções anteriores trataram principalmente da disponibilidade teórica das workloads e do que elas podem alcançar. São um conjunto importante de conceitos que você deve ter em mente ao criar sistemas distribuídos. Elas ajudarão a informar seu processo de seleção de dependências e como implementar a redundância.

Também analisamos a relação deMTTD,MTTR, e MTBF com a disponibilidade. Esta seção apresentará orientações práticas com base na teoria anterior. Em resumo, as cargas de trabalho de engenharia para alta disponibilidade visam aumentar MTBF e diminuir oMTTR, bem como o. MTTD

Embora eliminar todas as falhas seja o ideal, isso não é realista. Em grandes sistemas distribuídos com dependências profundamente empilhadas, ocorrerão falhas. “Tudo falha o tempo todo” (veja Werner Vogels, Amazon.comCTO, 10 lições de 10 anos de Amazon Web Services.) e “você não pode legislar contra falhas [então] foque na detecção e resposta rápidas”. (consulte Chris Pinkham, membro fundador da EC2 equipe da Amazon, ARC335Designing for failure: Architecting resilient systems on) AWS

O que isso significa é que, frequentemente, você não tem controle sobre se a falha acontece. O que você pode controlar é a rapidez com que detecta a falha e faz algo a respeito. Portanto, embora o aumento ainda MTBF seja um componente importante da alta disponibilidade, as mudanças mais significativas que os clientes têm sob seu controle são a redução MTTD MTTR e.