DataZone Terminologia e concetti di Amazon - Amazon DataZone

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

DataZone Terminologia e concetti di Amazon

Quando inizi a usare Amazon DataZone, è importante comprenderne i concetti chiave, la terminologia e i componenti.

DataZone Componenti Amazon

Amazon DataZone include i seguenti quattro componenti principali:

  • Catalogo dei dati aziendali: puoi utilizzare questo componente per catalogare i dati di tutta l'organizzazione in base al contesto aziendale e consentire così a tutti i membri dell'organizzazione di trovare e comprendere rapidamente i dati.

  • Flussi di lavoro di pubblicazione e sottoscrizione: puoi utilizzare questi flussi di lavoro automatizzati per proteggere i dati tra produttori e consumatori in modalità self-service e per garantire che tutti i membri dell'organizzazione abbiano accesso ai dati giusti per lo scopo giusto.

  • Progetti e ambienti

    • In Amazon, DataZone i progetti sono raggruppamenti di persone, risorse (dati) e strumenti basati su casi d'uso aziendale utilizzati per semplificare l'accesso alle analisi. AWS I progetti forniscono aree in cui i membri del progetto possono collaborare, scambiare dati e condividere risorse. Per impostazione predefinita, i progetti sono configurati in modo che solo coloro che vengono aggiunti esplicitamente al progetto possano accedere ai dati e agli strumenti di analisi al loro interno. I progetti gestiscono la proprietà delle risorse prodotte in conformità alle politiche di progetto a cui possono accedere i consumatori di dati.

    • All'interno dei DataZone progetti Amazon, gli ambienti sono raccolte di zero o più risorse configurate (ad esempio, un bucket Amazon S3, un AWS Glue database o un gruppo di lavoro Amazon Athena) su cui può operare un determinato set di principi IAM (ad esempio, utenti con autorizzazioni di contributore).

  • Portale dati (esterno alla console di AWS gestione): si tratta di un'applicazione Web basata su browser in cui diversi utenti possono catalogare, scoprire, governare, condividere e analizzare i dati in modalità self-service. Il portale dati autentica gli utenti con credenziali IAM o credenziali esistenti fornite dal provider di identità tramite. AWS IAM Identity Center

Cosa sono i DataZone domini Amazon?

Puoi utilizzare i DataZone domini Amazon per organizzare le tue risorse, gli utenti e i loro progetti. Associando AWS account aggiuntivi ai tuoi DataZone domini Amazon, puoi riunire le tue fonti di dati. Puoi quindi pubblicare le risorse provenienti da queste fonti di dati nel catalogo del tuo dominio, con moduli di metadati e glossari che migliorano la completezza e la qualità dei metadati. Puoi anche cercare e sfogliare queste risorse per vedere quali dati sono pubblicati nel dominio. Inoltre, puoi partecipare a progetti per collaborare con altri utenti, sottoscrivere risorse e utilizzare ambienti di progetto per accedere a strumenti di analisi, tra cui Amazon Athena e Amazon Redshift. DataZone I domini Amazon ti offrono la flessibilità necessaria per riflettere le esigenze di dati e analisi della tua struttura organizzativa, sia che si tratti di creare un singolo DataZone dominio Amazon per la tua azienda o più DataZone domini Amazon per diverse unità aziendali.

Cosa sono i DataZone progetti e gli ambienti Amazon?

Amazon DataZone consente ai team e agli utenti di analisi di collaborare ai progetti creando raggruppamenti di team, strumenti e dati basati su casi d'uso.

  • In Amazon DataZone, i progetti consentono a un gruppo di utenti di collaborare su vari casi d'uso aziendali che coinvolgono la pubblicazione, la scoperta, la sottoscrizione e l'utilizzo dei dati nel catalogo Amazon DataZone . I membri del progetto utilizzano risorse dal DataZone catalogo Amazon e producono nuove risorse utilizzando uno o più flussi di lavoro analitici. I progetti supportano le seguenti attività all'interno del portale dati:

    • I proprietari del progetto possono aggiungere membri con autorizzazioni di proprietario e collaboratore

    • I membri del progetto possono essere utenti SSO, gruppi SSO e utenti IAM

    • I membri del progetto possono richiedere l'abbonamento alle risorse nel catalogo dati

      Le approvazioni degli abbonamenti vengono fornite ai progetti

  • In un DataZone progetto Amazon, gli ambienti sono raccolte di zero o più risorse configurate (ad esempio, un Amazon S3, un AWS Glue database o un gruppo di lavoro Amazon Athena), con un determinato set di principi IAM che possono operare su tali risorse. Gli ambienti vengono creati utilizzando profili di ambiente, che sono set di risorse e progetti preconfigurati che forniscono modelli riutilizzabili per la creazione di ambienti. I profili di ambiente definiscono impostazioni come la regione Account AWS o la regione in cui vengono distribuiti gli ambienti.

Cosa sono i DataZone progetti Amazon?

Un blueprint con cui viene creato l'ambiente definisce quali AWS strumenti e servizi (ad esempio Amazon Redshift) i membri del progetto a cui appartiene l'ambiente possono utilizzare mentre lavorano con le risorse nel catalogo Amazon DataZone . AWS Glue

Nella versione corrente di Amazon DataZone, sono supportati i seguenti blueprint predefiniti:

Nome del progetto Descrizione Risorse create
Progetto Data Lake

Consente ai membri DataZone del progetto Amazon di lanciare servizi Data Lake per produttori e consumatori all'interno dell'ambiente.

In qualità di consumatore, consente ai membri DataZone del progetto Amazon di accedere a una copia «di sola lettura» degli asset gestiti da Lake Formation direttamente in Amazon Athena e in altri motori di query supportati da Lake Formation.

In qualità di produttore, consente ai membri DataZone del progetto Amazon di creare nuove tabelle LakeFormation gestite utilizzando Amazon Athena e di pubblicarle nel catalogo Amazon DataZone.

Fornisce agli utenti la possibilità di creare e interrogare tabelle Lake Formation utilizzando Amazon Athena. Gruppo di lavoro Amazon Athena, AWS Glue database con autorizzazioni Lake Formation «sola lettura», autorizzazioni IAM «sola lettura» e accesso ad Amazon S3 gestito dal progetto. AWS Glue database con autorizzazioni di «creazione» e «concessione» di Lake Formation, autorizzazioni IAM di «lettura» e «scrittura», AWS Glue ETL (estrazione, trasformazione e caricamento) con tag.
Progetto Data Warehouse

In qualità di consumatore, questo modello consente ai membri DataZone del progetto Amazon di connettersi ai propri cluster Amazon Redshift per interrogare archivi dati remoti e creare e archiviare nuovi set di dati.

In qualità di produttore, questo modello consente ai membri DataZone del progetto Amazon di connettersi ai propri cluster Amazon Redshift per interrogare archivi di dati remoti, creare nuovi set di dati e pubblicarli nel catalogo Amazon. DataZone

Accesso all'editor di query di Amazon Redshift, accesso in «lettura» alle fonti di dati sottoscritte dal DataZone catalogo Amazon, possibilità di creare risorse locali nel cluster Amazon Redshift configurato. Accesso all'editor di query di Amazon Redshift, accesso in «lettura» alle fonti di dati sottoscritte dal DataZone catalogo Amazon, possibilità di creare e pubblicare risorse dal cluster Amazon Redshift configurato.
Progetto Amazon Sagemaker

Questo modello aiuta i produttori di dati e i consumatori a passare senza problemi SageMaker ad Amazon per collaborare su progetti di machine learning (ML), rafforzando al contempo la governance dell'accesso ai dati e alle risorse ML. Con la nuova integrazione integrata tra Amazon DataZone e Amazon SageMaker, i consumatori e i produttori di dati possono semplificare la governance del machine learning in tutta la configurazione dell'infrastruttura, collaborare a iniziative aziendali e gestire facilmente dati e risorse ML.

Puoi creare un SageMaker dominio Amazon in grado di cercare, sottoscrivere e pubblicare dati e risorse ML in Amazon DataZone. Inoltre, puoi iscriverti e pubblicare sui database AWS Glue e sulla formazione di laghi come configurato.

Oltre ai blueprint integrati, puoi anche abilitare il blueprint di AWS servizio personalizzato che ti consente di configurare Amazon DataZone per utilizzare i tuoi ruoli e AWS servizi IAM esistenti che hai già configurato nella tua organizzazione. Per ulteriori informazioni, consulta Lavorare con progetti AWS di servizio personalizzati in Amazon DataZone.

Cosa sono i flussi di lavoro di DataZone inventario e pubblicazione di Amazon?

Creazione di risorse di inventario del progetto

Per utilizzare Amazon per DataZone catalogare i tuoi dati, devi prima importare i tuoi dati (asset) come inventario del tuo progetto in Amazon DataZone. La creazione di un inventario per un progetto rende le risorse individuabili solo dai membri di quel progetto. Le risorse dell'inventario del progetto non sono disponibili per tutti gli utenti del dominio in search/browse a meno che non vengano pubblicate esplicitamente. Nell'attuale versione di Amazon DataZone, puoi aggiungere risorse all'inventario del progetto nei seguenti modi:

  • Crea ed esegui fonti di dati tramite il portale dati o utilizzando le DataZone API di Amazon. Nell'attuale versione di Amazon DataZone, puoi creare ed eseguire fonti di dati per AWS Glue e Amazon Redshift. Creando ed eseguendo sorgenti dati AWS Glue o Amazon Redshift, crei risorse nell'inventario di un progetto scelto e ne importi i metadati tecnici dalle tabelle del database di origine o dai data warehouse come inventario in Amazon. DataZone

  • Utilizzando le API, puoi creare risorse dai tipi di asset di sistema disponibili (AWS Glue, Amazon Redshift, oggetti Amazon S3) o dai tuoi tipi di asset personalizzati.

    • Crea tipi di asset personalizzati nell'inventario di un progetto utilizzando le DataZone API di Amazon. I tipi di risorse personalizzati possono includere modelli ML, dashboard, tabelle locali, ecc.

    • Crea risorse da questi tipi di risorse personalizzate utilizzando le DataZone API di Amazon.

  • Crea manualmente risorse per oggetti S3 utilizzando il portale DataZone dati Amazon.

Gestione delle risorse di inventario del progetto: dopo aver creato un inventario del progetto, i proprietari dei dati possono curare le proprie risorse di inventario con i metadati aziendali richiesti aggiungendo o aggiornando nomi aziendali (asset e schema), descrizioni (asset e schema), readme, termini del glossario (asset e schema) e moduli di metadati. Puoi farlo tramite il portale dati o utilizzando le DataZone API di Amazon. Ogni modifica alla risorsa crea una nuova versione dell'inventario.

Pubblicazione delle risorse di inventario del progetto nel DataZone catalogo Amazon

Il passaggio successivo dell'utilizzo di Amazon DataZone per catalogare i dati consiste nel rendere le risorse di inventario del progetto individuabili dagli utenti del dominio. Puoi farlo pubblicando le risorse di inventario nel DataZone catalogo Amazon. Solo la versione più recente della risorsa di inventario può essere pubblicata nel catalogo e solo l'ultima versione pubblicata è attiva nel catalogo Discovery. Se una risorsa di inventario viene aggiornata dopo la sua pubblicazione nel DataZone catalogo Amazon, devi pubblicarla nuovamente in modo esplicito affinché la versione più recente sia presente nel catalogo Discovery. Nell'attuale versione di Amazon DataZone, puoi pubblicare le risorse di inventario dei tuoi progetti nel DataZone catalogo Amazon nei seguenti modi:

  • Pubblica manualmente le risorse dell'inventario del progetto nel DataZone catalogo Amazon tramite il portale dati o utilizzando le DataZone API di Amazon.

  • Come parte della creazione o della modifica delle fonti di dati, abilita le impostazioni opzionali Publish your AWS Glue sul catalogo o Pubblica le tue risorse Amazon Redshift nel catalogo da utilizzare durante le esecuzioni pianificate o automatizzate delle origini dati. Quando questa impostazione è abilitata, l'esecuzione di un'origine dati aggiunge risorse all'inventario del progetto e quindi pubblica anche le risorse di inventario nel DataZone catalogo Amazon. Tieni presente che se pubblichi direttamente, le risorse potrebbero non contenere metadati aziendali e saranno rese direttamente individuabili da tutti gli utenti del dominio. Puoi utilizzare questa impostazione sulle tue fonti di dati tramite il portale dati o utilizzando le DataZone API di Amazon.

Cosa sono i flussi di lavoro relativi agli DataZone abbonamenti e agli adempimenti di Amazon?

Una volta pubblicate le tue risorse nel DataZone catalogo Amazon, gli utenti del tuo dominio possono scoprirle, richiederle e accedervi e continuare a utilizzare Amazon DataZone per governare, condividere e analizzare queste risorse.

Gli utenti richiedono l'accesso a una risorsa sottoscrivendo tale risorsa per conto di un progetto. Una volta creata una richiesta di abbonamento, i proprietari della risorsa ricevono una notifica e possono esaminarla e decidere se approvarla o rifiutarla. Se la richiesta di sottoscrizione viene approvata dal proprietario dei dati, al progetto sottoscrittore viene concesso l'accesso a tale risorsa.

Una volta approvata una richiesta di abbonamento, Amazon DataZone avvia un flusso di lavoro di evasione dell'abbonamento che aggiunge automaticamente la risorsa a tutti gli ambienti applicabili all'interno del progetto creando le sovvenzioni necessarie in AWS Lake Formation o Amazon Redshift. Ciò consente ai membri del progetto abbonati di interrogare la risorsa utilizzando uno degli strumenti di query (Amazon Athena o Amazon Redshift query editor) nei propri ambienti.

Amazon DataZone può attivare questa logica di evasione automatica solo per le risorse gestite (incluse le tabelle AWS Glue e le tabelle e viste di Amazon Redshift). Per tutti gli altri tipi di risorse (risorse non gestite), Amazon non DataZone può attivare automaticamente l'adempimento, ma pubblica invece un evento in Amazon Eventbridge con tutti i dettagli necessari nel payload dell'evento in modo che tu possa creare le sovvenzioni necessarie al di fuori di Amazon. DataZone Amazon fornisce DataZone anche l'updateSubscriptionStatusAPI che consente di aggiornare lo stato dell'abbonamento una volta completato al di fuori di Amazon, in DataZone modo che Amazon DataZone possa notificare ai membri del progetto che possono iniziare a utilizzare la risorsa.

I personaggi utente di Amazon DataZone

Di seguito sono riportati i principali DataZone utenti di Amazon:

  • Amministratori di dominio proprietari della configurazione di Amazon DataZone come piattaforma di analisi per la propria organizzazione.

    Nel contesto di Amazon DataZone, gli amministratori di dominio installano Amazon DataZone negli AWS account, creano DataZone domini Amazon e configurano associazioni di AWS account e associazioni di provider di identità con i domini Amazon DataZone . Gli amministratori di dominio utilizzano anche altre console di AWS servizio come AWS Organization e Service Catalog per configurare Amazon. DataZone

  • Utenti di dati che sono i principali utenti di Amazon DataZone (editori di asset e abbonati) per le loro attività di analisi e apprendimento automatico.

    Gli utenti dei dati includono addetti all'analisi dei dati, data scientist e utenti di sistema che producono e consumano risorse di dati. Nel contesto di Amazon DataZone, gli utenti di dati creano e partecipano a progetti e ambienti, sottoscrivono e utilizzano asset di dati con strumenti di analisi o machine learning preconfigurati e pubblicano gli asset di dati di output nel catalogo di DataZone domini Amazon per condividerli con altri.

  • Sviluppatori di sistema che creano modelli di infrastruttura personalizzati e integrano Amazon DataZone con cataloghi o sistemi di produzione interni.

    Nel contesto di Amazon DataZone, gli sviluppatori di sistemi creano progetti di ambiente (modelli di infrastruttura) o pipeline CI/CD Infrastructure-As-Code come provider di ambiente, pipeline di dati per promuovere le risorse di dati tra gli ambienti, adattatori di sincronizzazione dei cataloghi e di evasione delle sovvenzioni per l'integrazione con i cataloghi interni o integrazioni tra le API di Amazon e le interfacce utente interne o i sistemi di produzione, se necessario. DataZone

  • Responsabili della governance dei dati che possiedono le definizioni e i rischi della sicurezza organizzativa, della privacy e di altre politiche di conformità e che si assicurano che l'utilizzo di Amazon DataZone nelle loro organizzazioni sia conforme a tali definizioni.

DataZone Terminologia Amazon

Domain

Un DataZone dominio Amazon è l'entità organizzativa per connettere le tue risorse, gli utenti e i loro progetti. Con DataZone i domini Amazon, hai la flessibilità necessaria per riflettere le esigenze di dati e analisi della tua struttura organizzativa, che si tratti di creare un singolo DataZone dominio Amazon per la tua azienda o più zone dati; domini per diverse unità aziendali o team.

Account associato

L'associazione AWS dei tuoi account ai DataZone domini Amazon ti consente di pubblicare i dati di questi AWS account nel DataZone catalogo Amazon e di creare DataZone progetti Amazon per utilizzare i tuoi dati su più AWS account. Le richieste di associazione di account possono essere avviate solo in AWS account che possiedono un DataZone dominio Amazon. Le richieste di associazione di account possono essere accettate solo dagli utenti amministrativi degli AWS account invitati. Una volta associato un AWS account a un DataZone dominio Amazon, puoi registrare le tue fonti di dati come AWS Glue catalog e Amazon Redshift in questo account su questo dominio. L'associazione consente inoltre a un AWS account di creare DataZone progetti e ambienti Amazon.

An Account AWS può essere associato a uno o più DataZone domini Amazon.

Origine dati

In Amazon DataZone, puoi utilizzare le fonti di dati per importare i metadati tecnici degli asset (dati) dai database di origine o dai data warehouse in Amazon. DataZone Nell'attuale versione di Amazon DataZone, puoi creare ed eseguire fonti di dati per AWS Glue e Amazon Redshift. Creando un'origine dati, stabilisci una connessione tra Amazon DataZone e la fonte (AWS Glue Data Catalog o Amazon Redshift Warehouse) che ti consente di leggere i metadati tecnici, inclusi nomi di tabelle, nomi di colonne e tipi di dati. Creando un'origine dati, dai anche il via all'esecuzione iniziale dell'origine dati che crea nuove risorse o aggiorna quelle esistenti in Amazon DataZone. Durante la creazione di un'origine dati o dopo che l'origine dati è stata creata correttamente, hai anche la possibilità di specificare una pianificazione per l'esecuzione dell'origine dati.

Esecuzione dell'origine dati

In Amazon DataZone, l'esecuzione di un'origine dati è un'attività che Amazon DataZone esegue per creare risorse negli inventari dei progetti e, facoltativamente, anche per pubblicare risorse di inventario del progetto nel catalogo Amazon DataZone . Le esecuzioni delle sorgenti dati possono essere automatizzate (avviate quando una fonte di dati viene inizialmente creata) o pianificata o manuale. I criteri di selezione dei dati consentono di ottimizzare i set di dati esistenti e futuri da inserire negli inventari dei progetti o nel catalogo DataZone Amazon e la frequenza degli aggiornamenti dei metadati di tali risorse di inventario o catalogo.

Obiettivo dell'abbonamento

In Amazon DataZone, gli obiettivi di abbonamento ti consentono di accedere ai dati a cui ti sei iscritto nei tuoi progetti. Un obiettivo di sottoscrizione specifica la posizione (ad esempio, un database o uno schema) e le autorizzazioni richieste (ad esempio, un ruolo IAM) che Amazon DataZone può utilizzare per stabilire una connessione con i dati di origine e per creare le concessioni necessarie in modo che i membri del DataZone progetto Amazon possano iniziare a interrogare i dati a cui si sono abbonati.

Richiesta di abbonamento

In Amazon DataZone, una richiesta di abbonamento è un processo che un DataZone progetto Amazon deve seguire per ottenere l'accesso a una risorsa specifica. Le richieste di abbonamento possono essere approvate, rifiutate, revocate o concesse.

Asset

In Amazon DataZone, una risorsa è un'entità che presenta un singolo oggetto di dati fisico (ad esempio, una tabella, un dashboard, un file) o un oggetto di dati virtuale (ad esempio, una vista).

Asset type (Tipo asset)

I tipi di asset definiscono il modo in cui gli asset vengono rappresentati nel DataZone catalogo Amazon. Un tipo di risorsa definisce lo schema per un tipo specifico di risorsa. Quando le risorse vengono create, vengono convalidate in base allo schema definito dal tipo di risorsa (per impostazione predefinita, la versione più recente). Quando si verifica un aggiornamento degli asset, Amazon DataZone crea una nuova versione dell'asset e consente DataZone agli utenti Amazon di operare su tutte le versioni degli asset.

Glossario aziendale

In Amazon DataZone, un glossario aziendale è una raccolta di termini commerciali che possono essere associati agli asset. Un glossario aziendale aiuta a garantire che gli stessi termini e le stesse definizioni vengano utilizzati in un'organizzazione in tutte le sue varie attività di analisi dei dati.

I termini di un glossario aziendale possono essere aggiunti alle risorse e alle colonne per classificare o migliorare l'identificazione di tali attributi durante la ricerca. Il glossario può essere selezionato come tipo di valore per un campo in un modulo di metadati associato a una risorsa. Quando un termine particolare viene selezionato come valore per il campo del modulo di metadati di una risorsa, gli utenti possono cercare il termine del glossario aziendale e trovare le risorse associate.

Tipo di modulo per metadati

Un tipo di modulo di metadati è un modello che definisce i metadati che vengono raccolti e salvati quando le risorse vengono create come inventario o pubblicate in un dominio Amazon DataZone . I tipi di modulo di metadati possono essere associati a una risorsa di dati. I tipi di modulo di metadati aiutano gli amministratori di dominio a definire i moduli di metadati necessari per quel dominio, ad esempio informazioni sulla conformità, informazioni sulle normative o classificazioni. Consente agli amministratori di dominio di personalizzare metadati aggiuntivi per le proprie risorse. Amazon DataZone dispone di tipi di moduli di metadati di sistema come asset-common-details-form -type, column-business-metadata-form -type,, glue-table-form-type, glue-view-form-type redshift-table-form-type, s3- redshift-view-form-typeobject-collection-form-type, e. subscription-terms-form-type suggestion-form-type

Modulo per i metadati

In Amazon DataZone, i moduli di metadati definiscono i metadati che vengono raccolti e salvati quando le risorse vengono create come inventario o pubblicate in un dominio Amazon DataZone . Le definizioni dei moduli di metadati vengono create nel dominio del catalogo da un amministratore di dominio. La definizione di un modulo di metadati è composta da una o più definizioni di campo, con supporto per i tipi di dati booleani, date, decimali, numeri interi, stringhe e valori dei campi del glossario aziendale.

Un amministratore di dominio applica un modulo di metadati alle risorse del proprio dominio aggiungendo il modulo di metadati al proprio dominio. Gli editori di risorse forniscono quindi tutti i valori di campo facoltativi e obbligatori nel modulo di metadati.

Progetto

In Amazon DataZone, i progetti consentono a un gruppo di utenti di collaborare su vari casi d'uso aziendali che prevedono la creazione di risorse negli inventari dei progetti e quindi la loro individuazione da parte di tutti i membri del progetto, quindi la pubblicazione, la scoperta, la sottoscrizione e il consumo di risorse nel catalogo Amazon. DataZone I membri del progetto utilizzano risorse dal DataZone catalogo Amazon e producono nuove risorse utilizzando uno o più flussi di lavoro analitici. I membri del progetto possono essere proprietari o collaboratori. I proprietari dei progetti possono aggiungere o rimuovere altri utenti come proprietari o collaboratori e possono modificare o eliminare i progetti. Altre restrizioni relative ai contributori possono essere definite mediante politiche. Quando un utente crea un progetto, diventa il primo proprietario di quel progetto.

Ambiente

Un ambiente è una raccolta di risorse configurate (ad esempio, un bucket Amazon S3, un AWS Glue database o un gruppo di lavoro Amazon Athena), con un determinato set di principali IAM (con autorizzazioni di collaboratore assegnate) che possono operare su tali risorse. Ogni ambiente può inoltre avere utenti principali autorizzati ad accedere alle risorse e ai dati tramite sottoscrizione e adempimento. Gli ambienti sono progettati per archiviare collegamenti utilizzabili verso AWS servizi, IDE e console esterni. I membri del progetto possono accedere a servizi come la console Amazon Athena e altro ancora tramite deep link configurati all'interno di un ambiente. Gli utenti SSO e gli utenti IAM del progetto possono essere ulteriormente ridotti per utilizzare/accedere ad ambienti specifici.

Profilo dell'ambiente

In Amazon DataZone, un profilo di ambiente è un modello che puoi utilizzare per creare ambienti. I profili di ambiente vengono creati utilizzando i blueprint.

Con i profili di ambiente, gli amministratori di dominio possono creare blueprint con parametri preconfigurati, quindi i data worker possono creare rapidamente un numero qualsiasi di nuovi ambienti selezionando i profili di ambiente esistenti e specificando i nomi per i nuovi ambienti. Ciò consente ai data worker di gestire in modo efficiente i propri progetti e ambienti, garantendo al contempo che soddisfino le politiche di governance dei dati applicate dagli amministratori di dominio.

Piano

Un blueprint con cui viene creato l'ambiente definisce quali AWS strumenti e servizi (ad esempio Amazon Redshift) i membri del progetto a cui appartiene l'ambiente possono utilizzare mentre lavorano con le risorse nel catalogo Amazon DataZone . AWS Glue

Nella versione corrente di Amazon sono supportati DataZone i seguenti blueprint:

  • Blueprint Data Lake

  • Progetto di data warehouse

  • Progetto Amazon Sagemaker

  • Progetto di servizio personalizzato AWS

Profilo utente

Un profilo utente rappresenta DataZone gli utenti Amazon. Amazon DataZone supporta sia i ruoli IAM che le identità SSO per interagire con la Console di DataZone gestione Amazon e il portale dati per scopi diversi. Gli amministratori di dominio utilizzano i ruoli IAM per eseguire il lavoro amministrativo iniziale relativo al dominio nella Console di DataZone gestione Amazon, tra cui la creazione di nuovi DataZone domini Amazon, la configurazione dei tipi di modulo di metadati e l'implementazione di politiche. I data worker utilizzano le loro identità aziendali SSO tramite Identity Center per accedere ad Amazon DataZone Data Portal e accedere ai progetti a cui sono iscritti.

Profilo del gruppo

I profili di gruppo rappresentano gruppi di DataZone utenti Amazon. I gruppi possono essere creati manualmente o mappati su gruppi di clienti aziendali di Active Directory. In Amazon DataZone, i gruppi hanno due scopi. Innanzitutto, un gruppo può associarsi a un team di utenti nell'organigramma e quindi ridurre il lavoro amministrativo del proprietario di un DataZone progetto Amazon quando ci sono nuovi dipendenti che entrano o escono da un team. In secondo luogo, gli amministratori aziendali utilizzano i gruppi di Active Directory per gestire e aggiornare gli stati degli utenti e quindi gli amministratori di DataZone dominio Amazon possono utilizzare queste appartenenze ai gruppi per implementare le politiche di dominio Amazon. DataZone

Amministratore di dominio

In Amazon DataZone, un principale IAM che crea un DataZone dominio Amazon è l'amministratore di dominio predefinito di quel dominio. Gli amministratori di dominio in Amazon DataZone eseguono funzionalità chiave per il dominio, tra cui la creazione di domini, l'assegnazione di altri amministratori di dominio, l'aggiunta di fonti di dati e obiettivi di abbonamento, la creazione di progetti e ambienti e l'assegnazione dei proprietari dei progetti.

Editore

In Amazon DataZone, gli editori pubblicano le risorse nel DataZone catalogo Amazon e possono modificare i metadati delle risorse che pubblicano. Se viene concessa questa autorità, gli editori possono approvare o rifiutare le richieste di abbonamento alle risorse che hanno pubblicato nel catalogo Amazon. DataZone

Sottoscrittore

In Amazon DataZone, un abbonato è un DataZone progetto Amazon che desidera trovare, accedere e utilizzare risorse nel catalogo Amazon DataZone .

Account AWS owner

In Amazon DataZone, Account AWS i proprietari creano ruoli, politiche e autorizzazioni Account AWS che consentono di associarli Account AWS ai DataZone domini Amazon.