Questa architettura di riferimento per i data lake è più applicabile alle organizzazioni aziendali?Posso ancora utilizzare questa architettura di riferimento se la mia organizzazione ha un solo produttore di dati?My data lake collega direttamente un produttore di dati con più consumatori di dati. L'architettura di riferimento del data lake di questa guida è ancora pertinente?La mia organizzazione deve seguire il flusso di lavoro relativo all'onboarding e alla concessione degli accessi senza apportare modifiche?

Domande frequenti

Questa sezione fornisce le risposte alle domande più frequenti sulla progettazione di un data lake per la crescita e la scalabilità su Cloud AWS.

Questa architettura di riferimento per i data lake è più applicabile alle organizzazioni aziendali?

L'architettura di riferimento dei data lake di questa guida può essere applicata ai data lake appartenenti a organizzazioni di qualsiasi dimensione. L'architettura di riferimento standardizza l'interfaccia di scambio dei dati, riduce il sovraccarico e i costi di manutenzione e crescita del data lake e può essere applicata a qualsiasi scala a cui cresce il data lake dell'organizzazione.

Posso ancora utilizzare questa architettura di riferimento se la mia organizzazione ha un solo produttore di dati?

L'architettura di riferimento del data lake di questa guida è ancora pertinente e vantaggiosa anche se l'organizzazione ha un solo produttore di dati. Senza un catalogo centralizzato, il produttore di dati deve gestire la crescita dei consumatori di dati, il che aumenta la complessità e il sovraccarico. Il data lake è anche una risorsa a lungo termine per l'organizzazione e in genere le organizzazioni aggiungono più produttori di dati. Ad esempio, potresti aver bisogno di un altro produttore di dati per archiviare dati sensibili per motivi di conformità o perché l'organizzazione acquisisca un'altra unità aziendale con un proprio produttore di dati.

My data lake collega direttamente un produttore di dati con più consumatori di dati. L'architettura di riferimento del data lake di questa guida è ancora pertinente?

L'architettura di riferimento del data lake gioverebbe alla tua organizzazione a lungo termine. Potresti utilizzare un approccio in due fasi e iniziare creando il catalogo centralizzato per i nuovi consumatori di dati. È quindi possibile collegare i consumatori di dati esistenti al catalogo centralizzato.

La mia organizzazione deve seguire il flusso di lavoro relativo all'onboarding e alla concessione degli accessi senza apportare modifiche?

No, lo scopo principale di quella sezione è illustrare i blocchi di attività logici richiesti durante il processo di onboarding. Tutte le organizzazioni dovrebbero personalizzare il processo e potrebbero anche avere più processi, a seconda della sensibilità dei dati.

Un'altra considerazione è che il flusso di processo utilizza l'approccio di condivisione basato sulle risorse in. AWS Lake Formation Esistono altri metodi di condivisione dei dati supportati da Lake Formation, come la condivisione basata su tag, in cui le differenze nel processo possono essere adattate al metodo di condivisione specifico.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Inserimento e concessione dell'accesso

Risorse