Panoramica della condivisione dei dati in Amazon Redshift - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Panoramica della condivisione dei dati in Amazon Redshift

Con la condivisione dei dati, puoi condividere in modo sicuro e semplice dati in tempo reale tra cluster Amazon Redshift.

Per informazioni su come iniziare a lavorare con la condivisione dei dati e gestire le condivisioni di dati utilizzando il, consulta. AWS Management ConsoleGestione delle attività di condivisione dati

Casi d'uso per la condivisione dei dati per Amazon Redshift

La condivisione dei dati di Amazon Redshift è particolarmente utile per questi casi d'uso:

  • Supporto dei diversi tipi di carichi di lavoro business-critical: utilizzare un cluster centrale di estrazione, trasformazione e caricamento (ETL) che condivide i dati con più cluster di business intelligence (BI) o di analisi. Questo approccio fornisce isolamento del carico di lavoro in lettura e storno di addebito per singoli carichi di lavoro. È possibile ridimensionare e scalare il singolo calcolo del carico di lavoro in base ai requisiti di prezzo e prestazioni specifici del carico di lavoro.

  • Abilitazione della collaborazione tra gruppi: abilitare la collaborazione continua tra team e gruppi di business per analisi più ampie, data science e analisi di impatto tra più prodotti.

  • Fornire dati come servizio: condividere i dati come servizio nell'intera organizzazione.

  • Condivisione dei dati tra ambienti: condividere i dati tra ambienti di sviluppo, test e produzione. È possibile migliorare l'agilità del team condividendo i dati a diversi livelli di granularità.

  • Licenza di accesso ai dati in Amazon Redshift: elenca i set di dati Amazon Redshift nel catalogo che AWS Data Exchange i clienti possono trovare, sottoscrivere e richiedere in pochi minuti.

Casi d'uso di condivisione dei dati e accesso in scrittura (anteprima)

La condivisione dei dati per le scritture ha diversi casi d'uso importanti:

  • Aggiorna i dati di origine aziendali relativi al produttore: puoi condividere i dati come servizio all'interno dell'organizzazione, ma in questo modo i consumatori possono anche eseguire azioni sui dati di origine. Ad esempio, possono restituire up-to-date valori o confermare la ricezione dei dati. Questi sono solo un paio di possibili casi d'uso aziendali.

  • Inserisci record aggiuntivi sul produttore: i consumatori possono aggiungere record ai dati di origine originali. Questi possono essere contrassegnati come provenienti dal consumatore, se necessario.

Per informazioni specifiche su come eseguire operazioni di scrittura su un datashare, vedere Condivisione dell'accesso in scrittura ai dati (anteprima).

Condivisione di dati a diversi livelli in Amazon Redshift

Con Amazon Redshift, è possibile condividere i dati a diversi livelli. Questi livelli includono database, schemi, tabelle, viste (incluse viste regolari, tardive e materializzate) e funzioni definite dall'utente (FDU) SQL. È possibile creare più unità di condivisione dati per un dato database. Una unità di condivisione dati può contenere oggetti provenienti da più schemi nel database in cui viene creata la condivisione.

Grazie a questa flessibilità nella condivisione dei dati, si ottiene un controllo degli accessi a grana fine. È possibile personalizzare questo controllo per diversi utenti e aziende che hanno bisogno di accedere ai dati di Amazon Redshift.

Gestione della consistenza dei dati in Amazon Redshift

Amazon Redshift offre coerenza transazionale su tutti i cluster di produttori e consumatori up-to-date e condivide visualizzazioni coerenti dei dati con tutti i consumatori.

È possibile aggiornare continuamente i dati nel cluster producer. Tutte le query su un cluster di consumer all'interno di una transazione leggono lo stesso stato dei dati condivisi. Amazon Redshift non prende in considerazione i dati che sono stati modificati da un'altra transazione nel cluster di producer di cui è stato eseguito il commit dopo l'inizio della transazione sul cluster di consumer. Dopo il commit della modifica dei dati nel cluster producer, le nuove transazioni nel cluster consumer possono eseguire immediatamente una query sui dati aggiornati.

L'elevata coerenza elimina i rischi di report aziendali a bassa affidabilità che potrebbero contenere risultati non validi durante la condivisione dei dati. Questo fattore è particolarmente importante per l'analisi finanziaria o dove i risultati potrebbero essere utilizzati per preparare set di dati che vengono utilizzati per addestrare modelli di machine learning.