Progettazione di sistemi distribuiti ad alta disponibilità su AWS - Disponibilità e oltre: comprensione e miglioramento della resilienza dei sistemi distribuiti su AWS

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Progettazione di sistemi distribuiti ad alta disponibilità su AWS

Le sezioni precedenti hanno riguardato principalmente la disponibilità teorica dei carichi di lavoro e i risultati che possono ottenere. Si tratta di un insieme importante di concetti da tenere a mente quando si creano sistemi distribuiti. Ti aiuteranno a orientare il processo di selezione delle dipendenze e a come implementare la ridondanza.

Abbiamo anche esaminato la relazione e MTBF la MTTD MTTR disponibilità. Questa sezione introdurrà una guida pratica basata sulla teoria precedente. In breve, i carichi di lavoro ingegneristici per l'alta disponibilità mirano ad aumentare MTBF e diminuire il MTTRMTTD.

Sebbene l'eliminazione di tutti i guasti sarebbe l'ideale, non è realistico. Nei sistemi distribuiti di grandi dimensioni con dipendenze fortemente impilate, si verificheranno dei guasti. «Tutto fallisce sempre» (vedi Werner Vogels, Amazon.comCTO, 10 lezioni da 10 anni di Amazon Web Services.) e «non puoi legiferare contro i fallimenti [quindi] concentrati su un rilevamento e una risposta rapidi». (vedi Chris Pinkham, membro fondatore del EC2 team Amazon, ARC335Designing for failure: Architecting resilient systems on) AWS

Ciò significa che spesso non si ha il controllo sull'eventualità che si verifichi un guasto. Ciò che puoi controllare è la rapidità con cui rilevi l'errore e fai qualcosa al riguardo. Pertanto, sebbene l'aumento MTBF sia ancora una componente importante dell'elevata disponibilità, i cambiamenti più importanti che i clienti possono controllare sono la riduzione MTTD e la riduzioneMTTR.