Resilienza nel servizio gestito da Amazon per Apache Flink - Servizio gestito per Apache Flink

Il servizio gestito per Apache Flink era precedentemente noto come Analisi dei dati Amazon Kinesis per Apache Flink.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Resilienza nel servizio gestito da Amazon per Apache Flink

L'infrastruttura globale di AWS è basata su Regioni e zone di disponibilità AWS. Le Regioni AWS forniscono più zone di disponibilità fisicamente separate e isolate che sono connesse tramite reti altamente ridondanti, a bassa latenza e velocità effettiva elevata. Con le zone di disponibilità, è possibile progettare e gestire applicazioni e database che eseguono il failover automatico tra zone di disponibilità senza interruzioni. Le zone di disponibilità sono più disponibili, tolleranti ai guasti e scalabili rispetto alle infrastrutture tradizionali a data center singolo o multiplo.

Per ulteriori informazioni sulle Regioni e zone di disponibilità AWS, consulta Infrastruttura globale di AWS.

Oltre all'infrastruttura globale di AWS, un servizio gestito per Apache Flink offre numerose funzionalità per supportare la resilienza dei dati e le esigenze di backup.

Ripristino di emergenza

Il servizio gestito per Apache Flink viene eseguito in una modalità serverless e si occupa di degradazioni host, disponibilità della zona di disponibilità e altri problemi correlati all'infrastruttura eseguendo la migrazione automatica. Il servizio gestito per Apache Flink raggiunge questo obiettivo attraverso numerosi meccanismi ridondanti. Ogni applicazione del servizio gestito per Apache Flink viene eseguita in un cluster Apache Flink a tenant singolo. Il cluster Apache Flink viene eseguito JobMananger in modalità ad alta disponibilità utilizzando Zookeeper su più zone di disponibilità. Il servizio gestito per Apache Flink utilizza Apache Flink tramite Amazon EKS. In Amazon EKS vengono utilizzati più pod Kubernetes per ogni regione AWS nelle zone di disponibilità. In caso di errore, il servizio gestito per Apache Flink tenta innanzitutto di ripristinare l'applicazione all'interno del cluster Apache Flink in esecuzione utilizzando i checkpoint dell'applicazione, se disponibili.

Il servizio gestito per Apache Flink esegue il backup dello stato dell'applicazione utilizzando checkpoint e snapshot:

  • I checkpoint sono backup dello stato dell'applicazione che il servizio gestito per Apache Flink crea periodicamente in modo automatico e utilizza per il ripristino dai guasti.

  • Gli snapshot sono backup dello stato dell'applicazione creati e ripristinati manualmente.

Per ulteriori informazioni su checkpoint e snapshot, consulta Tolleranza agli errori.

Controllo delle versioni

Il controllo delle versioni dello stato dell'applicazione archiviate viene eseguito nel modo seguente:

  • Il controllo delle versioni dei checkpoint viene eseguito in modo automatico dal servizio. Se il servizio utilizza un checkpoint per riavviare l'applicazione, verrà utilizzato il checkpoint più recente.

  • I savepoint vengono versionati utilizzando il parametro dell'azione. SnapshotNameCreateApplicationSnapshot

Il servizio gestito per Apache Flink crittografa i dati archiviati nei checkpoint e nei savepoint.