Disaster recovery e cluster globali Amazon DocumentDB - Amazon DocumentDB

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Disaster recovery e cluster globali Amazon DocumentDB

Utilizzando un cluster globale, puoi eseguire rapidamente il ripristino da disastri come i guasti regionali. Il ripristino in caso di emergenza viene in genere misurato utilizzando i valori per RTO e. RPO

  • Obiettivo del tempo di ripristino (RTO): il tempo impiegato da un sistema per tornare allo stato operativo dopo un disastro. In altre parole, RTO misura i tempi di inattività. Per un cluster globale, RTO in pochi minuti.

  • Recovery Point Objective (RPO): la quantità di dati che è possibile perdere (misurata nel tempo). Per un cluster globale, RPO viene generalmente misurata in secondi.

  • Per eseguire il ripristino da un'interruzione non pianificata, è possibile eseguire un failover tra aree geografiche su una delle unità secondarie del cluster globale. Se il cluster globale ha più regioni secondarie, assicurati di scollegare tutte le regioni secondarie che desideri promuovere come principali. Quindi, promuovi una di queste regioni secondarie affinché diventi la nuova principale. Regione AWS Infine, crei nuovi cluster in ciascuna delle altre regioni secondarie e colleghi tali cluster al tuo cluster globale.

Esecuzione di un failover gestito per un cluster globale Amazon DocumentDB

Questo approccio è destinato alla continuità aziendale in caso di una reale emergenza a livello regionale o di un'interruzione completa del livello di servizio.

Durante un failover gestito, il cluster primario viene eseguito il failover nella regione secondaria prescelta, mentre viene mantenuta la topologia di replica esistente del cluster globale Amazon DocumentDB. Il cluster secondario scelto promuove uno dei suoi nodi di sola lettura allo stato di istanza di scrittura completa. Questo passaggio consente al cluster di assumere il ruolo di cluster primario. Il database non sarà disponibile per un breve periodo di tempo mentre il cluster sta assumendo il suo nuovo ruolo. I dati che non sono stati replicati dal vecchio cluster primario al cluster secondario scelto potrebbero mancare quando questo secondario diventa il nuovo primario. Il vecchio volume primario fa del suo meglio per scattare un'istantanea prima di sincronizzarsi con il nuovo volume primario, in modo che i dati non replicati vengano conservati nell'istantanea.

Nota

È possibile eseguire un failover di cluster interregionale gestito su un cluster globale Amazon DocumentDB solo se i cluster primari e secondari hanno le stesse versioni del motore principale, secondaria e a livello di patch. Tuttavia, i livelli di patch possono essere diversi, a seconda della versione secondaria del motore. Se le versioni del motore non sono compatibili, puoi eseguire il failover manualmente seguendo i passaggi indicati in Esecuzione di un failover manuale per un cluster globale Amazon DocumentDB.

Per ridurre al minimo la perdita di dati, è consigliabile eseguire le seguenti operazioni prima di utilizzare questa funzionalità:

  • Metti offline le applicazioni per evitare che le scritture vengano inviate al cluster primario del cluster globale Amazon DocumentDB.

  • Controlla i tempi di ritardo per tutti i cluster secondari di Amazon DocumentDB. La scelta della regione secondaria con il minor ritardo di replica può ridurre al minimo la perdita di dati relativamente all'attuale regione primaria in stato di errore. Controlla i tempi di ritardo per tutti i cluster secondari di Amazon DocumentDB nel cluster globale visualizzando la GlobalClusterReplicationLag metrica in Amazon. CloudWatch Questi parametri mostrano quanto sia indietro (in millisecondi) la replica su un cluster secondario rispetto al cluster primario.

    Per ulteriori informazioni sui CloudWatch parametri per Amazon DocumentDB, consulta. Metriche di Amazon DocumentDB

Durante un failover gestito, il cluster secondario scelto viene promosso al suo nuovo ruolo di primario. Tuttavia, non eredita le varie opzioni di configurazione del cluster primario. Una mancata corrispondenza nella configurazione può causare problemi di prestazioni, incompatibilità dei carichi di lavoro e altri comportamenti anomali. Per evitare tali problemi, ti consigliamo di risolvere le differenze tra i cluster globali di Amazon DocumentDB per quanto segue:

  • Se necessario, configura un gruppo di parametri del cluster Amazon DocumentDB per il nuovo cluster primario: puoi configurare i gruppi di parametri del cluster Amazon DocumentDB in modo indipendente per ogni cluster nei cluster globali Amazon DocumentDB. Pertanto, quando promuovi un cluster secondario affinché assuma il ruolo principale, il gruppo di parametri del secondario potrebbe essere configurato in modo diverso rispetto a quello primario. In tal caso, modifica il gruppo di parametri del cluster secondario promosso in modo che sia conforme alle impostazioni del cluster primario. Per scoprire come, consulta Modifica dei gruppi di parametri del cluster Amazon DocumentDB.

  • Configura strumenti e opzioni di monitoraggio, come CloudWatch eventi e allarmi Amazon: configura il cluster promosso con la stessa capacità di registrazione, allarmi e così via necessari per il cluster globale. Come per i gruppi di parametri, la configurazione di queste funzionalità non viene ereditata dal primario durante il processo di failover. Alcune CloudWatch metriche, come il ritardo di replica, sono disponibili solo per le regioni secondarie. Pertanto, un failover modifica il modo in cui visualizzare tali metriche e impostare i relativi allarmi e potrebbe richiedere modifiche da apportare a qualsiasi dashboard predefinito. Per ulteriori informazioni sui cluster e sul monitoraggio di Amazon DocumentDB, consulta. Monitoraggio di Amazon DocumentDB

In genere, il cluster secondario scelto assume il ruolo primario entro pochi minuti. Non appena il nodo di scrittura della nuova regione primaria è disponibile, puoi connettervi le tue applicazioni e riprendere i tuoi carichi di lavoro. Dopo aver promosso il nuovo cluster primario, Amazon DocumentDB ricostruisce automaticamente tutti i cluster regionali secondari aggiuntivi.

Poiché i cluster globali di Amazon DocumentDB utilizzano la replica asincrona, il ritardo di replica in ciascuna regione secondaria può variare. Amazon DocumentDB ricostruisce queste regioni secondarie in modo che abbiano esattamente gli stessi point-in-time dati del nuovo cluster Region primario. La durata dell'attività di ricostruzione completa può richiedere da alcuni minuti a diverse ore, a seconda delle dimensioni del volume di archiviazione e della distanza tra regioni. Quando i cluster regionali secondari terminano la ricostruzione in base alla nuova regione primaria, diventano disponibili per l'accesso in lettura. Non appena il nuovo writer primario viene promosso e disponibile, il cluster della nuova regione primaria può gestire le operazioni di lettura e scrittura per il cluster globale Amazon DocumentDB.

Per ripristinare la topologia originale del cluster globale, Amazon DocumentDB monitora la disponibilità della vecchia regione primaria. Non appena la regione è di nuovo integra e disponibile, Amazon DocumentDB la riaggiunge automaticamente al cluster globale come regione secondaria. Prima di creare il nuovo volume di storage nella vecchia regione primaria, Amazon DocumentDB tenta di scattare un'istantanea del vecchio volume di storage nel punto in cui si è verificato l'errore. Ciò consente di usare lo snapshot per recuperare i dati mancanti. Se questa operazione ha esito positivo, Amazon DocumentDB inserisce questa istantanea denominata «rds: docdb-unplanned-global-failover - name-of-old-primary -DB-Cluster-Timestamp» nella sezione snapshot di. AWS Management Console Puoi anche vedere questa istantanea elencata nelle informazioni restituite dall'operazione. DescribeDBClusterSnapshots API

Nota

Lo snapshot del vecchio volume di archiviazione è uno snapshot del sistema soggetto al periodo di conservazione del backup configurato sul vecchio cluster primario. Per conservare questo snapshot oltre il periodo di conservazione, puoi copiarlo e salvarlo come snapshot manuale. Per ulteriori informazioni sulla copia degli snapshot, inclusi i prezzi, consulta Copiare uno snapshot del cluster.

Dopo il ripristino della topologia originale, è possibile eseguire il failback del cluster globale nella regione primaria originale eseguendo un'operazione di switchover nel momento più opportuno per l'azienda e il carico di lavoro. A tale scopo, segui la procedura in Esecuzione di uno switchover per un cluster globale Amazon DocumentDB.

Puoi eseguire il failover del tuo cluster globale Amazon DocumentDB utilizzando Amazon DocumentDB o Amazon DocumentDB. AWS Management Console AWS CLI API

Using the AWS Management Console

Per eseguire il failover gestito sul tuo cluster globale Amazon DocumentDB

  1. Accedi a e apri AWS Management Console la console Amazon DocumentDB all'indirizzo https://console.aws.amazon.com /docdb.

  2. Nel pannello di navigazione scegliere Clusters (Cluster).

  3. Trova e scegli il cluster globale Amazon DocumentDB di cui desideri eseguire il failover.

    Immagine: tabella del cluster con cluster globale selezionato.
  4. Scegli Switchover o Failover dal menu Azioni.

  5. Nella finestra di dialogo che appare, scegli Failover, quindi scegli il cluster secondario dall'elenco a discesa del campo Nuovo cluster primario.

    Immagine: finestra di dialogo di switchover o failover del cluster globale.
  6. Digita «conferma» nell'ultimo campo. Quindi scegli Conferma.

    Lo stato del cluster primario cambia in "Failing-over». Questa condizione dovrebbe richiedere circa un minuto. Durante questo periodo, lo stato del nuovo cluster primario mostra "Modifica in corso... ». Una volta promosso, il nuovo primario mostrerà "Disponibile" e sarà in grado di fornire transazioni di lettura e scrittura. Le regioni secondarie, inclusa la vecchia primaria, mostreranno "Risincronizzazione... «mentre si risincronizza con il nuovo primario. Analogamente al nuovo primario, sarà in grado di eseguire la transazione solo quando lo stato passerà a "Disponibile».

  7. Una volta completato, il cluster primario originale diventa il cluster secondario. Il cluster secondario selezionato diventa il cluster primario.

    Immagine: tabella dei cluster che mostra il nuovo cluster primario.
Using the AWS CLI

Per eseguire il failover gestito sul tuo cluster globale Amazon DocumentDB

Usa il failover-global-cluster CLI comando per eseguire il failover del cluster globale Amazon DocumentDB. Con il comando, passa i valori per i seguenti parametri:

  • --region— Specificare Regioni AWS dove è in esecuzione il cluster primario del cluster globale Amazon DocumentDB.

  • --global-cluster-identifier— Specificare il nome del cluster globale Amazon DocumentDB.

  • --target-db-cluster-identifier— Specificare l'Amazon Resource Name (ARN) del cluster secondario Amazon DocumentDB che desideri promuovere come principale per il cluster globale Amazon DocumentDB.

  • --allow-data-loss— Rendi esplicitamente questa operazione un'operazione di failover anziché un'operazione di switchover. Un'operazione di failover può causare una perdita di dati se i componenti della replica asincrona non hanno completato l'invio di tutti i dati replicati alla regione secondaria.

Per Linux, macOS o Unix:

aws docdb --region region_of_selected_secondary \ failover-global-cluster --global-cluster-identifier global_cluster_id \ --target-db-cluster-identifier arn_of_secondary_to_promote \ --allow-data-loss

Per Windows:

aws docdb --region region_of_selected_secondary ^ failover-global-cluster --global-cluster-identifier global_cluster_id ^ --target-db-cluster-identifier arn_of_secondary_to_promote ^ --allow-data-loss

Esecuzione di un failover manuale per un cluster globale Amazon DocumentDB

Se un intero cluster in uno Regione AWS diventa non disponibile, puoi promuovere un altro cluster del cluster globale affinché disponga di funzionalità di lettura/scrittura.

È possibile attivare manualmente il meccanismo di failover globale del cluster se un cluster in un altro Regione AWS è la scelta migliore come cluster principale. Ad esempio, potrebbe essere necessario incrementare la capacità di uno dei cluster secondari e quindi promuoverlo a cluster primario. Oppure l'equilibrio delle attività tra i due Regioni AWS potrebbe cambiare, in modo che il passaggio dal cluster primario a un altro Regione AWS potrebbe comportare una minore latenza per le operazioni di scrittura.

La procedura seguente descrive cosa fare per promuovere uno dei cluster secondari in un cluster globale Amazon DocumentDB.

Per promuovere un cluster secondario:

  1. Interrompi l'emissione di DML istruzioni e altre operazioni di scrittura sul cluster primario in Regione AWS caso di interruzione.

  2. Identifica un cluster da un cluster secondario Regione AWS da utilizzare come nuovo cluster primario. Se hai due (o più) cluster secondari Regioni AWS nel tuo cluster globale, scegli il cluster secondario con il minor ritardo.

  3. Scollega il cluster secondario scelto dal cluster globale.

    La rimozione di un cluster secondario da un cluster globale interrompe immediatamente la replica dal primario a questo secondario e la promuove verso un cluster autonomo con funzionalità di lettura/scrittura complete. Qualsiasi altro cluster secondario associato al cluster primario nella regione interessata dall'interruzione è ancora disponibile e può accettare chiamate dall'applicazione. Inoltre consumano risorse. Poiché state ricreando il cluster globale, per evitare problemi di tipo split-brain e di altro tipo, rimuovete gli altri cluster secondari prima di creare il nuovo cluster globale nei passaggi seguenti.

    Per i passaggi dettagliati per lo scollegamento, consulta Rimozione di un cluster da un cluster globale Amazon DocumentDB.

  4. Questo cluster diventa il cluster principale di un nuovo cluster globale quando inizi ad aggiungervi regioni, nel passaggio successivo.

  5. Aggiungi un Regione AWS al cluster. Quando esegui questa operazione, inizia il processo di replica da primario a secondario.

  6. Aggiungine altro Regioni AWS se necessario per ricreare la topologia necessaria per supportare l'applicazione. Assicurati che le scritture delle applicazioni vengano inviate al cluster corretto prima, durante e dopo aver apportato modifiche come queste, per evitare incongruenze di dati tra i cluster del cluster globale (problemi di split-brain).

  7. Quando l'interruzione è stata risolta e sei pronto a riassegnare il cluster originale Regione AWS come cluster primario, esegui la stessa procedura in senso inverso.

  8. Rimuovi uno dei cluster secondari dal cluster globale. Ciò gli consentirà di servire traffico di lettura/scrittura.

  9. Reindirizza tutto il traffico di scrittura al cluster primario dell'originale. Regione AWS

  10. Aggiungi un Regione AWS per configurare uno o più cluster secondari nello stesso modo di prima Regione AWS .

I cluster globali di Amazon DocumentDB possono essere gestiti utilizzando AWS SDKs, il che consente di creare soluzioni per automatizzare il processo di failover globale dei cluster per i casi d'uso di Disaster Recovery e Business Continuity Planning. Una di queste soluzioni è disponibile per i nostri clienti con licenza Apache 2.0 ed è accessibile dal nostro repository di strumenti qui. Questa soluzione sfrutta Amazon Route 53 per la gestione degli endpoint e fornisce AWS Lambda funzioni che possono essere attivate in base a eventi appropriati.

Esecuzione di uno switchover per un cluster globale Amazon DocumentDB

Utilizzando gli switchover, puoi modificare la regione del cluster primario su base regolare. Questo approccio è destinato agli scenari controllati, ad esempio durante la manutenzione operativa e altre procedure operative pianificate.

Esistono tre casi d'uso comuni per l'utilizzo degli switchover:

  • Per i requisiti relativi alla "rotazione regionale" imposti a settori specifici. Ad esempio, le normative sui servizi finanziari potrebbero imporre che i sistemi di livello 0 passino a un'altra regione per diversi mesi per garantire l'esecuzione regolare delle procedure di ripristino di emergenza.

  • Per applicazioni "" multiregionali. follow-the-sun Ad esempio, un'azienda potrebbe voler fornire scritture con latenza inferiore in diverse regioni in base all'orario di lavoro nei vari fusi orari.

  • Come zero-data-loss metodo per tornare alla regione principale originale dopo un failover.

Nota

Gli switchover sono progettati per essere utilizzati su un cluster globale Amazon DocumentDB integro. Per eseguire il ripristino da un'interruzione non pianificata, segui la procedura appropriata in Esecuzione di un failover manuale per un cluster globale Amazon DocumentDB.

Per eseguire uno switchover, il cluster database secondario di destinazione deve eseguire la stessa versione del motore del cluster primario, incluso il livello di patch, a seconda della versione del motore. Per ulteriori informazioni, consulta Compatibilità a livello di patch per switchover e failover gestiti tra regioni. Prima di iniziare lo switchover, controlla le versioni del motore nel cluster globale per assicurarti che supportino lo switchover gestito tra regioni e, se necessario, aggiornale. Amazon DocumentDB bloccherà automaticamente le chiamate al cluster di switchover se le versioni del motore non corrispondono.

Durante uno switchover, Amazon DocumentDB trasferisce il cluster primario alla regione secondaria prescelta mantenendo la topologia di replica esistente del cluster globale. Prima di avviare il processo di passaggio, Amazon DocumentDB attende che tutti i cluster regionali secondari siano completamente sincronizzati con il cluster Region primario. Il cluster database nella regione primaria diventa di sola lettura e il cluster secondario scelto promuove uno dei relativi nodi di sola lettura allo stato di nodo di scrittura completa. La promozione di questo nodo a nodo di scrittura consente a tale cluster secondario di assumere il ruolo di cluster primario. Poiché tutti i cluster secondari sono stati sincronizzati con quello primario all'inizio del processo, il nuovo cluster primario continua a operare per il cluster globale Amazon DocumentDB senza perdere alcun dato. Il database non è disponibile per un breve periodo, mentre i cluster primario e secondario selezionati assumono i loro nuovi ruoli.

Per ottimizzare la disponibilità delle applicazioni, è consigliabile eseguire le seguenti operazioni prima di utilizzare questa funzionalità:

  • Esegui questa operazione durante le ore non di punta o in un altro momento in cui le scritture sul cluster primario sono minime.

  • Metti offline le applicazioni per evitare che le scritture vengano inviate al cluster primario del cluster globale Amazon DocumentDB.

  • Controlla i tempi di ritardo per tutti i cluster secondari di Amazon DocumentDB nel cluster globale visualizzando la GlobalClusterReplicationLag metrica in Amazon. CloudWatch Questa metrica mostra quanto sia indietro (in millisecondi) la replica su un cluster secondario rispetto al cluster primario. Questo valore è direttamente proporzionale al tempo impiegato da Amazon DocumentDB per completare lo switchover. Di conseguenza, maggiore è il valore del ritardo, maggiore sarà il tempo necessario per lo switchover.

    Per ulteriori informazioni sui CloudWatch parametri per Amazon DocumentDB, consulta. Metriche di Amazon DocumentDB

Durante uno switchover gestito, il cluster database secondario scelto viene promosso al nuovo ruolo primario. Tuttavia, non eredita le varie opzioni di configurazione del cluster di database primario. Una mancata corrispondenza nella configurazione può causare problemi di prestazioni, incompatibilità dei carichi di lavoro e altri comportamenti anomali. Per evitare tali problemi, ti consigliamo di risolvere le differenze tra i cluster globali di Amazon DocumentDB per quanto segue:

  • Se necessario, configura il gruppo di parametri del cluster Amazon DocumentDB per il nuovo cluster primario: puoi configurare i gruppi di parametri del cluster Amazon DocumentDB in modo indipendente per ogni cluster del tuo cluster globale Amazon DocumentDB. Ciò significa che quando si promuove un cluster di database secondario perché assuma il ruolo primario, il gruppo di parametri dal secondario potrebbe essere configurato in modo diverso rispetto al primario. In tal caso, modifica il gruppo di parametri del cluster di database secondario promosso in modo che sia conforme alle impostazioni del cluster primario. Per scoprire come, consulta Gestione dei gruppi di parametri del cluster Amazon DocumentDB.

  • Configura strumenti e opzioni di monitoraggio, come Amazon CloudWatch Events e allarmi: configura il cluster promosso con la stessa capacità di registrazione, allarmi e così via necessari per il cluster globale. Come per i gruppi di parametri, la configurazione di queste funzionalità non viene ereditata dal ruolo primario durante il processo di switchover. Alcune CloudWatch metriche, come il ritardo di replica, sono disponibili solo per le regioni primarie. Pertanto, uno switchover modifica il modo in cui visualizzare tali metriche e impostare i relativi allarmi e potrebbe richiedere modifiche da apportare a qualsiasi dashboard predefinito. Per ulteriori informazioni, consulta Monitoraggio di Amazon DocumentDB.

Nota

In genere, lo switchover del ruolo può richiedere fino a diversi minuti.

Una volta completato il processo di passaggio, il cluster Amazon DocumentDB promosso può gestire le operazioni di scrittura per il cluster globale.

Puoi passare da un cluster globale di Amazon DocumentDB utilizzando AWS Management Console o: AWS CLI

Using the AWS Management Console

Per eseguire lo switchover sul tuo cluster globale Amazon DocumentDB

  1. Accedi a e apri AWS Management Console la console Amazon DocumentDB all'indirizzo https://console.aws.amazon.com /docdb.

  2. Nel pannello di navigazione scegliere Clusters (Cluster).

  3. Trova e seleziona il cluster globale Amazon DocumentDB da trasferire.

    Immagine: tabella del cluster con cluster globale selezionato.
  4. Scegli Switchover o Failover dal menu Azioni.

  5. Nella finestra di dialogo che appare, scegli Switchover, quindi scegli il cluster secondario dall'elenco a discesa del campo Nuovo cluster primario.

    Immagine: finestra di dialogo di commutazione del cluster con il cluster secondario selezionato.
  6. Scegli Conferma.

    Lo stato del cluster primario cambia in "Switching-over». Questa condizione dovrebbe richiedere circa tre minuti. Durante questo periodo, lo stato di tutti i cluster regionali mostra "Modifica... ». Una volta sincronizzate le regioni e promosso il nuovo primario, verrà visualizzato il messaggio "Disponibile" per tutti i campi di stato e sarà possibile gestire le transazioni.

  7. Una volta completato, il cluster primario originale diventa il cluster secondario. Il cluster secondario selezionato diventa il cluster primario.

    Immagine: tabella dei cluster che mostra il nuovo cluster primario.
Using the AWS CLI

Per eseguire lo switchover sul tuo cluster globale Amazon DocumentDB

Usa il switchover-global-cluster CLI comando per passare al cluster globale Amazon DocumentDB. Con il comando, passa i valori per i seguenti parametri:

  • --region— Specificare Regioni AWS dove è in esecuzione il cluster primario del cluster globale Amazon DocumentDB.

  • --global-cluster-identifier— Specificare il nome del cluster globale Amazon DocumentDB.

  • --target-db-cluster-identifier— Specificare l'Amazon Resource Name (ARN) del cluster secondario Amazon DocumentDB che desideri promuovere come principale per il cluster globale Amazon DocumentDB.

Per Linux, macOS o Unix:

aws docdb --region region_of_primary \ switchover-global-cluster --global-cluster-identifier global_cluster_id \ --target-db-cluster-identifier arn_of_secondary_to_promote

Per Windows:

aws docdb --region region_of_primary ^ switchover-global-cluster --global-cluster-identifier global_cluster_id ^ --target-db-cluster-identifier arn_of_secondary_to_promote