Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Domande frequenti
Questa sezione fornisce le risposte alle domande più frequenti sulla progettazione di un data lake per la crescita e la scalabilità su Cloud AWS.
Questa architettura di riferimento per i data lake è più applicabile alle organizzazioni aziendali?
L'architettura di riferimento dei data lake di questa guida può essere applicata ai data lake appartenenti a organizzazioni di qualsiasi dimensione. L'architettura di riferimento standardizza l'interfaccia di scambio dei dati, riduce il sovraccarico e i costi di manutenzione e crescita del data lake e può essere applicata a qualsiasi scala a cui cresce il data lake dell'organizzazione.
Posso ancora utilizzare questa architettura di riferimento se la mia organizzazione ha un solo produttore di dati?
L'architettura di riferimento del data lake di questa guida è ancora pertinente e vantaggiosa anche se l'organizzazione ha un solo produttore di dati. Senza un catalogo centralizzato, il produttore di dati deve gestire la crescita dei consumatori di dati, il che aumenta la complessità e il sovraccarico. Il data lake è anche una risorsa a lungo termine per l'organizzazione e in genere le organizzazioni aggiungono più produttori di dati. Ad esempio, potresti aver bisogno di un altro produttore di dati per archiviare dati sensibili per motivi di conformità o perché l'organizzazione acquisisca un'altra unità aziendale con un proprio produttore di dati.
My data lake collega direttamente un produttore di dati con più consumatori di dati. L'architettura di riferimento del data lake di questa guida è ancora pertinente?
L'architettura di riferimento del data lake gioverebbe alla tua organizzazione a lungo termine. Potresti utilizzare un approccio in due fasi e iniziare creando il catalogo centralizzato per i nuovi consumatori di dati. È quindi possibile collegare i consumatori di dati esistenti al catalogo centralizzato.
La mia organizzazione deve seguire il flusso di lavoro relativo all'onboarding e alla concessione degli accessi senza apportare modifiche?
No, lo scopo principale di quella sezione è illustrare i blocchi di attività logici richiesti durante il processo di onboarding. Tutte le organizzazioni dovrebbero personalizzare il processo e potrebbero anche avere più processi, a seconda della sensibilità dei dati.
Un'altra considerazione è che il flusso di processo utilizza l'approccio di condivisione basato sulle risorse in. AWS Lake Formation Esistono altri metodi di condivisione dei dati supportati da Lake Formation, come la condivisione basata su tag, in cui le differenze nel processo possono essere adattate al metodo di condivisione specifico.