Snapshot e backup di Amazon Redshift - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Snapshot e backup di Amazon Redshift

Le istantanee sono point-in-time backup di un cluster. Esistono due tipi di snapshot: automatici e manuali. Amazon Redshift archivia queste istantanee internamente in Amazon S3 utilizzando una connessione crittografata Secure Sockets Layer (). SSL

Amazon Redshift acquisisce automaticamente snapshot incrementali che tengono traccia delle modifiche al cluster dal momento dell'esecuzione dello snapshot automatico precedente. Gli snapshot automatizzati conservano tutti i dati necessari per ripristinare un cluster da uno snapshot. Puoi creare una pianificazione degli snapshot per controllare quando vengono eseguiti gli snapshot automatici oppure acquisire uno snapshot manuale in qualsiasi momento.

Quando si esegue il ripristino da uno snapshot, Amazon Redshift crea un nuovo cluster e lo rende disponibile prima che tutti i dati vengano caricati, in modo che sia possibile iniziare immediatamente a eseguire query sul nuovo cluster. Il cluster trasmette i dati on demand dallo snapshot in risposta alle query attive, quindi carica i dati rimanenti in background.

Quando avvii un cluster, puoi impostare il periodo di conservazione degli snapshot automatici e manuali; È possibile modificare il periodo di conservazione di default degli snapshot automatici e manuali modificando il cluster. Puoi modificare il periodo di conservazione di uno snapshot manuale al momento della sua creazione oppure modificando lo snapshot stesso.

È possibile monitorare lo stato di avanzamento delle istantanee visualizzando i dettagli delle istantanee nel AWS Management Console, oppure describe-cluster-snapshotschiamando CLI o l'DescribeClusterSnapshotsAPIazione. Per uno snapshot in corso, vengono visualizzate informazioni come la dimensione dello snapshot incrementale, la velocità di trasferimento, il tempo trascorso e il tempo rimanente stimato.

Per garantire che i backup siano sempre disponibili per il cluster, Amazon Redshift archivia gli snapshot in un bucket Amazon S3 gestito internamente da Amazon Redshift. Per gestire gli addebiti di archiviazione, valutare il numero di giorni per cui è necessario conservare gli snapshot automatici e configurare il periodo di conservazione di conseguenza. Eliminare gli snapshot manuali non più necessari. Per ulteriori informazioni sui costi di archiviazione di backup, consultare la pagina dei prezzi di Amazon Redshift.

Utilizzo di istantanee e backup in Amazon Redshift Serverless

Amazon Redshift Serverless, come un cluster con provisioning, consente di eseguire un backup come point-in-time rappresentazione degli oggetti e dei dati nel namespace. Esistono due tipi di backup in Amazon Redshift Serverless: istantanee create manualmente e punti di ripristino creati automaticamente da Amazon Redshift Serverless. Puoi trovare ulteriori informazioni sull'utilizzo degli snapshot per Amazon Redshift Serverless su Snapshot e punti di ripristino.

Puoi anche ripristinare uno snapshot da un cluster fornito in uno spazio dei nomi serverless. Per ulteriori informazioni, vedere Ripristino di uno spazio dei nomi serverless da un'istantanea.

Snapshot automatici

Quando gli snapshot automatici sono abilitati per un cluster, Amazon Redshift esegue periodicamente l'acquisizione degli snapshot per quel cluster. Per impostazione predefinita, Amazon Redshift acquisisce uno snapshot ogni otto ore o ogni 5 GB di modifiche dei dati per nodo, a seconda di quale evento si verifica prima. Se i dati sono più grandi di 5 GB * come numero di nodi, il periodo di tempo minimo tra la creazione automatica di snapshot è di 15 minuti. In alternativa, puoi creare una pianificazione degli snapshot per controllare quando vengono eseguiti gli snapshot automatici. Se utilizzi pianificazioni personalizzate, il tempo minimo tra gli snapshot automatici è di un'ora. Gli snapshot automatici sono abilitati per impostazione predefinita al momento della creazione di un cluster.

Gli snapshot automatici vengono eliminati alla fine del periodo di conservazione. Il periodo di conservazione predefinito è di un giorno, ma puoi modificarlo utilizzando la console Amazon Redshift o a livello di codice utilizzando Amazon Redshift o. API CLI

Per disabilitare gli snapshot automatici, imposta il periodo di conservazione su zero. Se disabiliti gli snapshot automatici, Amazon Redshift smette di acquisire snapshot ed elimina eventuali snapshot automatici esistenti per il cluster. Non puoi disabilitare le istantanee automatiche per i tipi di nodi. RA3 È possibile impostare un periodo di conservazione automatico del tipo di RA3 nodo da 1 a 35 giorni.

Solo Amazon Redshift può eliminare uno snapshot automatico; non è possibile eliminarlo manualmente. Amazon Redshift elimina gli snapshot automatici alla fine del periodo di conservazione, quando vengono disabilitati gli snapshot automatici per un cluster o quando si elimina il cluster. Amazon Redshift conserva l'ultimo snapshot automatizzato fino a quando non vengono disabilitati gli snapshot automatizzati o si elimina il cluster.

Se desideri conservare uno snapshot automatico per un periodo più lungo, puoi crearne una copia come snapshot manuale. Lo snapshot automatico viene conservato fino alla fine del periodo di conservazione, mentre lo snapshot manuale corrispondente viene conservato fino a quando non viene eliminato manualmente o fino alla fine del periodo di conservazione.

Pianificazioni di snapshot automatici

Per controllare con precisione quando vengono acquisiti gli snapshot, puoi creare una pianificazione di snapshot e collegarla a uno o più cluster. Quando modifichi una pianificazione di snapshot, la pianificazione viene modificata per tutti i cluster associati. Se a un cluster non è associata una pianificazione di snapshot, il cluster utilizza la pianificazione di snapshot automatici predefinita.

Una pianificazione di snapshot è un set di regole di pianificazione. È possibile definire una regola di pianificazione semplice in base a un intervallo specificato, ad esempio ogni 8 ore o ogni 12 ore. Puoi anche aggiungere le regole per acquisire gli snapshot in determinati giorni della settimana, in momenti specifici o durante periodi specifici. Le regole possono anche essere definite usando espressioni cron di tipo Unix.

Formato di una pianificazione di snapshot

Nella console Amazon Redshift è possibile creare una pianificazione di snapshot. Quindi, colleghi la pianificazione a un cluster per attivare la creazione di uno snapshot di sistema. Puoi collegare una pianificazione a più cluster e creare più definizioni cron in una pianificazione per attivare uno snapshot.

Puoi definire una pianificazione per gli snapshot utilizzando una sintassi cron. La definizione di queste pianificazioni usa una sintassi cron modificata di tipo Unix. L'ora viene specificata in Tempo universale coordinato () UTC. Puoi creare pianificazioni con una frequenza massima di un'ora e una precisione minima di un minuto.

Le espressioni cron modificate da Amazon Redshift hanno 3 campi obbligatori che sono separati da uno spazio.

Sintassi

cron(Minutes Hours Day-of-month Month Day-of-week Year)
Campi Valori Caratteri jolly

Minuti

0-59

, - * /

Ore

0-23

, - * /

D ay-of-month

1-31

, - * ? / L W

Mese

1—12 o - JAN DEC

, - * /

D ay-of-week

1—7 o - SUN SAT

, - * ? L #

Anno

1970–2199

, - * /

Caratteri jolly
  • Il carattere jolly , (virgola) include valori aggiuntivi. Nel campo Day-of-week, MON,WED,FRI includono lunedì, mercoledì e venerdì. I valori totali sono limitati a 24 per campo.

  • Il carattere jolly - (trattino) specifica gli intervalli. Nel campo Hour, 1-15 include le ore dall'1 alle 15 del giorno specificato.

  • Il carattere jolly * (asterisco) include tutti i valori nel campo. Nel campo Hours, * include ogni ora.

  • Il carattere jolly / (barra) specifica gli incrementi. Nel campo Hours puoi immettere 1/10 per specificare ogni decima ora, a partire dalla prima ora del giorno (ad esempio, 01:00, 11:00 e 21:00).

  • Il carattere jolly ? (punto interrogativo) specifica un valore. Nel Day-of-month campo puoi inserire 7, e se non ti interessa in che giorno della settimana è il settimo, puoi inserire? nel ay-of-week campo D.

  • Il carattere jolly L nel campo Day-of-month o Day-of-week specifica l'ultimo giorno del mese o della settimana.

  • Il carattere jolly W nel campo Day-of-month specifica un giorno feriale. Nel campo Day-of-month, 3W specifica il giorno più vicino al terzo giorno feriale del mese.

  • Il carattere jolly # nel ay-of-week campo D specifica una determinata istanza del giorno della settimana specificato nell'arco di un mese. Ad esempio, 3#2 sarebbe il secondo martedì del mese: il 3 fa riferimento a martedì perché è il terzo giorno di ogni settimana e il 2 fa riferimento al secondo giorno di questo tipo in un mese.

    Nota

    Se si utilizza un carattere '#', è possibile definire solo un'espressione nel day-of-week campo. Ad esempio, "3#1,6#3" non è valido perché viene interpretato come due espressioni.

Limiti
  • Non puoi specificare i campi Day-of-month e Day-of-week nella stessa espressione cron. Se specifichi un valore in uno dei campi, devi usare un carattere ? nell'altro campo.

  • Le pianificazioni degli snapshot non supportano le seguenti frequenze:

    • Snapshot pianificati più frequentemente di uno all'ora.

    • Snapshot pianificati meno frequentemente di uno al giorno (24 ore).

    Se sono presenti pianificazioni sovrapposte che determinano la pianificazione di snapshot nell'arco di un'ora, viene generato un errore di convalida.

Quando crei una pianificazione puoi utilizzare le seguenti stringhe cron di esempio.

Minuti Ore Giorno della settimana Significato

0

14-20/1

TUE

Ogni ora tra le 14:00 e le 20:00 di martedì.

0

21

MON-FRI

Tutte le sere alle 21, dal lunedì al venerdì.

30

0/6

SAT-SUN

Ogni 6 ore di incremento il sabato e la domenica a partire da 30 minuti dopo la mezzanotte (00:30) di quel giorno. Ciò restituisce uno snapshot alle [00:30, 06:30, 12:30 e 18:30] ogni giorno.

30

12/4

*

Ogni 4 ore di incremento a partire dalle 12:30 ogni giorno. Pertanto, il risultato restituito è [12:30, 16:30, 20:30].

Ad esempio per eseguire una pianificazione ogni 2 ore di incremento a partire dalle 15:15 ogni giorno. Pertanto, il risultato restituito è [15:15, 17:15, 19:15, 21:15, 23:15], specifica:

cron(15 15/2 *)

Puoi creare più definizioni della pianificazione cron all'interno di una pianificazione. Ad esempio quanto segue AWS CLI il comando contiene due pianificazioni cron in una pianificazione.

create-snapshot-schedule --schedule-identifier "my-test" --schedule-definition "cron(0 17 SAT,SUN)" "cron(0 9,17 MON-FRI)"

Snapshot manuali

Puoi acquisire uno snapshot manuale in qualsiasi momento. Per impostazione predefinita, gli snapshot manuali vengono conservati per un periodo indefinito anche dopo l'eliminazione del cluster. Puoi specificare il periodo di conservazione al momento della creazione di uno snapshot manuale oppure cambiare tale periodo modificando lo snapshot stesso. Per ulteriori informazioni su come modificare il periodo di conservazione del registro, consultare Modifica del periodo di conservazione manuale delle istantanee.

Se uno snapshot viene eliminato, non puoi avviare nuove operazioni che fanno riferimento a tale snapshot. Se, tuttavia, è in corso un'operazione di ripristino, tale operazione verrà eseguita fino al completamento.

Amazon Redshift prevede una quota che limita il numero totale di istantanee manuali che è possibile creare; tale quota si intende per AWS account per AWS Regione. Le quote di default sono elencate nella pagina Quote e limiti in Amazon Redshift.

Archiviazione delle istantanee

Poiché gli snapshot comportano costi di archiviazione, è importante eliminarli quando non sono più necessari. Amazon Redshift elimina gli snapshot automatici e manuali alla fine dei rispettivi periodi di conservazione. È inoltre possibile eliminare le istantanee manualmente utilizzando AWS Management Console o con il batch-delete-cluster-snapshotsCLIcomando.

Puoi modificare il periodo di conservazione di uno snapshot manuale cambiando le relative impostazioni.

Puoi ottenere informazioni sulla quantità di storage consumata dagli snapshot utilizzando la console Amazon Redshift o il comando describe-storage. CLI

Esclusione di tabelle dagli snapshot

Per impostazione predefinita, negli snapshot vengono incluse tutte le tabelle permanenti definite dall'utente. Se il backup di una tabella, ad esempio una tabella di gestione temporanea, non è necessario, puoi ridurre significativamente il tempo necessario per la creazione di snapshot e il ripristino dagli snapshot. Puoi inoltre ridurre lo spazio di storage in Amazon S3 usando una tabella senza backup. Per creare una tabella senza backup, includi il parametro BACKUP NO quando crei la tabella. Per ulteriori informazioni, consulta CREATETABLEe CREATETABLEAS nella Amazon Redshift Database Developer Guide.