Architettura di riferimento - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Architettura di riferimento

Il diagramma seguente mostra l'architettura di riferimento di questa guida per la crescita e la scalabilità di un data lake su. Cloud AWS

L'architettura di riferimento della guida per la crescita e la scalabilità di un data lake.

Il diagramma mostra i seguenti componenti:

  1. Un livello di produzione di dati diverso. Account AWS

  2. Un livello di consumo di dati in un altro modo Account AWS.

  3. Un catalogo centralizzato in un Account AWS.

  4. Sebbene ogni linea di business abbia un solo produttore di dati e un solo consumatore di dati, l'architettura di riferimento della guida supporta più produttori e consumatori di dati per ogni linea di business. È tipico integrare un produttore di dati con uno o più consumatori di dati che includano sia tipi di server di dati che tipi di applicazioni. Per ulteriori informazioni su questo argomento, consulta la Componenti dell'architettura di riferimento sezione di questa guida.

  5. Il catalogo centralizzato è l'interfaccia utilizzata dai produttori di dati e dai consumatori di dati per condividere e consumare dati.

L'approccio dell'architettura di riferimento consente di standardizzare la condivisione e il consumo dei dati e di scalare in modo indipendente i produttori e i consumatori di dati senza aumentare il sovraccarico di gestione. L'architettura di riferimento consente inoltre la produzione e la distribuzione dei dati tra diversi produttori di dati. Qualsiasi produttore di dati può far parte del data lake, condividere i propri dati e contribuire al valore complessivo fornito dal data lake.

Questo approccio consente all'organizzazione di raccogliere il valore dei dati in tutte le linee di business e tra i proprietari di dati esterni, senza creare problemi limitando la raccolta e l'elaborazione dei dati in un'unica pipeline.