Analisi dell'impatto aziendale e valutazione del rischio Obiettivi di ripristino (RTO e RPO)

Piano di continuità operativa (BCP)

Il piano di disaster recovery dovrebbe essere un sottoinsieme del piano di continuità aziendale (BCP) dell'organizzazione, non dovrebbe essere un documento a sé stante. Non ha senso mantenere obiettivi di disaster recovery aggressivi per il ripristino di un carico di lavoro se gli obiettivi aziendali di tale carico di lavoro non possono essere raggiunti a causa dell'impatto del disastro su elementi dell'azienda diversi dal carico di lavoro. Ad esempio, un terremoto potrebbe impedirti di trasportare i prodotti acquistati sulla tua applicazione di eCommerce: anche se un DR efficace mantiene il carico di lavoro funzionante, il tuo BCP deve soddisfare le esigenze di trasporto. La strategia di disaster recovery deve basarsi sui requisiti, sulle priorità e sul contesto aziendali.

Analisi dell'impatto aziendale e valutazione del rischio

Un'analisi dell'impatto aziendale dovrebbe quantificare l'impatto aziendale di un'interruzione dei carichi di lavoro. Dovrebbe identificare l'impatto sui clienti interni ed esterni dell'impossibilità di utilizzare i carichi di lavoro e l'effetto che ciò ha sulla vostra attività. L'analisi dovrebbe aiutare a determinare la rapidità con cui il carico di lavoro deve essere reso disponibile e la quantità di perdita di dati che può essere tollerata. Tuttavia, è importante notare che gli obiettivi di ripristino non devono essere fissati isolatamente; la probabilità di interruzione e il costo del ripristino sono fattori chiave che contribuiscono a determinare il valore aziendale della fornitura di disaster recovery per un carico di lavoro.

L'impatto aziendale può dipendere dal tempo. Potresti prendere in considerazione la possibilità di tenere conto di questo aspetto nella tua pianificazione del disaster recovery. Ad esempio, è probabile che l'interruzione del sistema di gestione delle retribuzioni abbia un impatto molto forte sull'azienda appena prima che tutti vengano pagati, ma può avere un impatto minore subito dopo che tutti sono già stati pagati.

Una valutazione del rischio del tipo di disastro e dell'impatto geografico, insieme a una panoramica dell'implementazione tecnica del carico di lavoro, determinerà la probabilità che si verifichino interruzioni per ogni tipo di emergenza.

Per carichi di lavoro altamente critici, potresti prendere in considerazione l'implementazione dell'infrastruttura in più regioni con replica dei dati e backup continui per ridurre al minimo l'impatto aziendale. Per i carichi di lavoro meno critici, una strategia valida potrebbe essere quella di non implementare affatto il disaster recovery. Inoltre, per alcuni scenari di emergenza, è utile non adottare alcuna strategia di disaster recovery che consenta di prendere una decisione informata basata su una bassa probabilità che il disastro si verifichi. Ricorda che le zone di disponibilità all'interno di una regione AWS sono già progettate con una distanza significativa tra loro e un'attenta pianificazione della posizione, in modo che i disastri più comuni abbiano un impatto solo su una zona e non sulle altre. Pertanto, un'architettura Multi-AZ all'interno di una regione AWS potrebbe già soddisfare gran parte delle tue esigenze di mitigazione del rischio.

Il costo delle opzioni di disaster recovery deve essere valutato per garantire che la strategia di disaster recovery fornisca il giusto livello di valore aziendale considerando l'impatto e il rischio aziendali.

Con tutte queste informazioni, è possibile documentare la minaccia, il rischio, l'impatto e il costo dei diversi scenari di emergenza e le opzioni di ripristino associate. Queste informazioni devono essere utilizzate per determinare gli obiettivi di ripristino per ciascuno dei carichi di lavoro.

Obiettivi di ripristino (RTO e RPO)

Quando si crea una strategia di Disaster Recovery (DR), le organizzazioni generalmente pianificano il Recovery Time Objective (RTO) e il Recovery Point Objective (RPO).

Immagine che mostra la relazione tra gli obiettivi di ripristino.

Figura 3 - Obiettivi di ripristino

Il Recovery Time Objective (RTO) è il ritardo massimo accettabile tra l'interruzione del servizio e il ripristino del servizio. Questo obiettivo determina quale finestra temporale è considerata accettabile quando il servizio non è disponibile ed è definito dall'organizzazione.

In questo paper vengono discusse principalmente quattro strategie di disaster recovery: backup e ripristino, pilot light, warm standby e multisito active/active (vedi Opzioni di disaster recovery nel cloud). Nel diagramma seguente, l'azienda ha determinato l'RTO massimo consentito e il limite di quanto può spendere per la strategia di ripristino dei servizi. Considerati gli obiettivi aziendali, le strategie DR Pilot Light o Warm Standby soddisferanno sia l'RTO che i criteri di costo.

Grafico che mostra l'obiettivo del tempo di ripristino come rapporto tra costi e complessità e durata dell'interruzione del servizio.

Figura 4 - Obiettivo del tempo di ripristino

Il Recovery Point Objective (RPO) è il periodo di tempo massimo accettabile dall'ultimo punto di ripristino dei dati. Questo obiettivo determina ciò che è considerato una perdita accettabile di dati tra l'ultimo punto di ripristino e l'interruzione del servizio ed è definito dall'organizzazione.

Nel diagramma seguente, l'azienda ha determinato l'RPO massimo consentito e il limite di quanto può spendere per la propria strategia di ripristino dei dati. Delle quattro strategie DR, Pilot Light o Warm Standby DR soddisfano entrambi i criteri di RPO e di costo.

Grafico che mostra l'obiettivo del punto di ripristino come rapporto tra costi e complessità e perdita di dati prima dell'interruzione del servizio.

Figura 5 - Obiettivo del punto di ripristino

Nota

Se il costo della strategia di ripristino è superiore al costo dell'errore o della perdita, l'opzione di ripristino non dovrebbe essere adottata a meno che non vi sia un fattore secondario, come i requisiti normativi. Quando effettui questa valutazione, prendi in considerazione strategie di ripristino a costi variabili.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

L'elevata disponibilità non è sinonimo di disaster recovery

Il disaster recovery è diverso nel cloud