Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Dati in AWS Data Exchange
I dati sono organizzati AWS Data Exchange utilizzando tre elementi costitutivi:
-
Risorse: un dato
-
Revisioni: un contenitore per una o più risorse
-
Set di dati: una serie di una o più revisioni
Questi tre elementi costitutivi costituiscono la base del prodotto che gestisci utilizzando la AWS Data Exchange console o il AWS Data Exchange API.
Per creare, visualizzare, aggiornare o eliminare set di dati, puoi utilizzare la AWS Data Exchange console, il AWS Command Line Interface (AWS CLI), il tuo REST client o uno dei AWS SDKs. Per ulteriori informazioni sulla gestione programmatica AWS Data Exchange dei set di dati, consulta la AWS Data Exchange API Guida di riferimento.
Asset
Le risorse sono i dati in esso contenuti. AWS Data Exchange
Il tipo di risorsa definisce il modo in cui i dati vengono consegnati al destinatario o all'abbonato tramite i set di dati, le concessioni di dati o i prodotti che li contengono.
Una risorsa può essere una delle seguenti:
-
Un file memorizzato nel computer locale
-
Un file archiviato come oggetto in Amazon Simple Storage Service (Amazon S3)
-
Un REST API prodotto creato in Amazon API Gateway
-
Un set di dati Amazon Redshift
-
Un'autorizzazione per AWS Lake Formation i dati (anteprima)
-
Un set di dati di accesso ai dati Amazon S3
Struttura di asset
Gli asset hanno i seguenti parametri:
-
DataSetId
— L'ID del set di dati che contiene questa risorsa. -
RevisionId
— L'ID della revisione che contiene questa risorsa. -
Id
— Un ID univoco generato al momento della creazione della risorsa. -
Arn
— Un identificatore univoco per il nome di una AWS risorsa. -
CreatedAt
eUpdatedAt
— Data e ora della creazione e dell'ultimo aggiornamento della risorsa. -
AssetDetails
— Informazioni sulla risorsa. -
AssetType
— Un'istantanea di un oggetto Amazon S3, un Amazon API Gateway, un set di dati Amazon Redshift o un set di dati Amazon S3. API
Esempio risorsa patrimoniale
{ "Name": "
automation/cloudformation.yaml
", "Arn": "arn:aws:dataexchange:us-east-1::data-sets/29EXAMPLE24b82c6858af3cEXAMPLEcf
/revisions/bbEXAMPLE74c02f4745c660EXAMPLE20
/assets/baEXAMPLE660c9fe7267966EXAMPLEf5
", "Id": "baEXAMPLE660c9fe7267966EXAMPLEf5
", "CreatedAt": "2019-10-17T21:31:29.833Z", "UpdatedAt": "2019-10-17T21:31:29.833Z", "AssetType": "S3_SNAPSHOT", "RevisionId": "bbEXAMPLE74c02f4745c660EXAMPLE20
", "DataSetId": "29EXAMPLE24b82c6858af3cEXAMPLEcf
", "AssetDetails": { "S3SnapshotAsset": { "Size": 9423 } } }
tipi di asset
Tipi
Set di dati di file
Utilizzando File, gli abbonati possono accedere a una copia del set di dati come set di dati autorizzato ed esportare le risorse.
Il proprietario di un set di dati può importare ed esportare file utilizzando la AWS Data Exchange console, programmaticamente tramite la AWS CLI propria REST applicazione o una delle. AWS SDKs Per ulteriori informazioni, sull'importazione di asset Amazon S3, vedi. Importazione di AWS Data Exchange risorse da un bucket S3 Per ulteriori informazioni sull'esportazione degli asset, consulta. Esportazione di AWS Data Exchange risorse in un bucket S3
APIrisorse
Con API le risorse, i destinatari dei dati o gli abbonati possono visualizzare API e scaricare le API specifiche come set di dati autorizzato. Puoi anche effettuare API chiamate agli endpoint AWS Data Exchange-managed, che vengono poi inoltrati tramite proxy agli endpoint -owner. API
Il proprietario di un set di dati che dispone di un Amazon API Gateway esistente API può aggiungere una API risorsa utilizzando la AWS Data Exchange console, programmaticamente tramite o uno dei. AWS CLI AWS SDKs Per ulteriori informazioni sull'importazione di API risorse, consulta. Importazione di AWS Data Exchange risorse da Amazon API Gateway API
Nota
Attualmente, l'SendApiAsset
operazione non è supportata per quanto segue: SDKs
-
AWS SDK for .NET
-
AWS SDK for C++
-
SDKper Java 2.x
I proprietari di set di dati che non dispongono di un Amazon API Gateway esistente API devono crearne uno prima di aggiungere una API risorsa al loro prodotto. Per ulteriori informazioni, consulta Developing a REST API in API Gateway nella Amazon API Gateway Developer Guide.
Risorse di condivisione dati Amazon Redshift
Con gli asset di datashare di Amazon Redshift, i destinatari possono ottenere l'accesso in sola lettura per interrogare i dati in Amazon Redshift senza estrarre, trasformare e caricare i dati.
Per ulteriori informazioni sull'importazione di asset datashare Amazon Redshift, consulta. Importazione di AWS Data Exchange risorse da un AWS Data Exchange datashare per Amazon Redshift
AWS Lake Formation autorizzazione dei dati (anteprima)
Con le risorse di autorizzazione AWS Lake Formation dei dati, i destinatari o gli abbonati possono accedere e interrogare tutti i database, le tabelle o le colonne associati ai tag specificati.
I proprietari dei set di dati devono creare e contrassegnare i propri dati prima di importarli come parte di una risorsa. AWS Data Exchange Per ulteriori informazioni sull'importazione delle risorse di autorizzazione dei dati di Lake Formation, vedereImportazione di AWS Data Exchange risorse da AWS Lake Formation (Anteprima).
Accesso ai dati Amazon S3
Con le risorse di accesso ai dati di Amazon S3, i destinatari o gli abbonati possono accedere e utilizzare direttamente i dati del provider senza creare o gestire copie dei dati. I proprietari di set di dati possono configurare Amazon S3 in aggiunta ai loro bucket Amazon S3 esistenti AWS Data Exchange per condividere l'accesso diretto a un intero bucket S3 o a prefissi e oggetti Amazon S3 specifici.
Revisioni
Una revisione è un contenitore per una o più risorse.
Utilizzi le revisioni per aggiornare i dati in Amazon S3. Ad esempio, puoi raggruppare una raccolta di file.csv o un singolo file.csv e un dizionario per creare una revisione. Man mano che sono disponibili nuovi dati, create revisioni e aggiungete risorse. Dopo aver creato e finalizzato la revisione utilizzando la AWS Data Exchange console, tale revisione sarà immediatamente disponibile per gli abbonati. Per ulteriori informazioni, consulta Pubblicazione di un nuovo prodotto in AWS Data Exchange.
Ricorda quanto segue:
-
Per essere finalizzata, una revisione deve contenere almeno una risorsa.
-
È responsabilità dell'utente assicurarsi che le risorse siano corrette prima di finalizzare la revisione.
-
Una revisione definitiva pubblicata su almeno un data grant o un prodotto non può essere definalizzata o modificata in alcun modo. (Ad eccezione del processo di revoca della revisione)
-
Una volta completata, la revisione viene pubblicata automaticamente nei tuoi dati, concessioni o prodotti.
Struttura delle revisioni
Le revisioni hanno i seguenti parametri:
-
DataSetId
— L'ID del set di dati che contiene questa revisione. -
Comment
— Un commento sulla revisione. Questo campo può contenere 128 caratteri. -
Finalized
— Vero o falso. Utilizzato per indicare se la revisione è stata completata. -
Id
— L'identificatore univoco della revisione generata al momento della creazione. -
Arn
— Un identificatore univoco per il nome di una AWS risorsa. -
CreatedAt
— Data e ora di creazione della revisione. Le revisioni autorizzate vengono create al momento della pubblicazione. -
UpdatedAt
— Data e ora dell'ultimo aggiornamento della revisione. -
Revoked
— Uno stato che indica che l'accesso degli abbonati alla revisione è stato revocato. -
RevokedAt
— Data e ora che indicano quando l'accesso degli abbonati alla revisione è stato revocato. -
RevocationComment
— Un commento obbligatorio per informare gli abbonati del motivo per cui il loro accesso alla revisione è stato revocato. La lunghezza minima richiesta dei caratteri è 10. Questo campo può contenere tra 10 e 512 caratteri. -
SourceID
— L'ID di revisione della revisione proprietaria corrispondente alla revisione con titolo visualizzata. Questo parametro viene restituito quando il proprietario della revisione visualizza la copia autorizzata della revisione di cui è proprietario.
Esempio risorsa di revisione
{ "UpdatedAt": "2019-10-11T14:13:31.749Z", "DataSetId": "
1EXAMPLE404460dc9b005a0d9EXAMPLE2f
", "Comment": "initial data revision
", "Finalized": true, "Id": "e5EXAMPLE224f879066f9999EXAMPLE42
", "Arn": "arn:aws:dataexchange:us-east-1:123456789012
:data-sets/1EXAMPLE404460dc9b005a0d9EXAMPLE2f
/revisions/e5EXAMPLE224f879066f9999EXAMPLE42
", "CreatedAt": "2019-10-11T14:11:58.064Z" }
set di dati
Un set di dati AWS Data Exchange è una raccolta di dati che può cambiare nel tempo.
Quando i destinatari o gli abbonati accedono a un set di dati Files, accedono a una revisione specifica del set di dati. Questa struttura consente ai provider di modificare i dati disponibili nei set di dati nel tempo senza doversi preoccupare delle modifiche ai dati storici.
Quando i destinatari o gli abbonati accedono a un set di API dati, accedono a un set di dati che contiene API risorse che consentono agli abbonati di effettuare API chiamate verso endpoint AWS Data Exchange gestiti, che vengono poi inoltrati tramite proxy agli endpoint del provider.
Quando i destinatari o gli abbonati accedono a un set di dati Amazon Redshift, accedono a AWS Data Exchange un datashare per Amazon Redshift. Questo datashare offre agli abbonati l'accesso in sola lettura agli schemi, alle tabelle, alle viste e alle funzioni definite dall'utente che il proprietario dei dati ha aggiunto alle condivisioni di dati.
Quando i destinatari o gli abbonati accedono a un set di dati di autorizzazioni AWS Lake Formation dati, accedono ai database, alle tabelle e/o alle colonne contrassegnate con un tag LF specificato dal proprietario del set di dati.
Quando i destinatari o gli abbonati accedono a un set di dati di accesso ai dati di Amazon S3, ottengono l'accesso in sola lettura agli oggetti Amazon S3 condivisi ospitati nei bucket Amazon S3 del provider. I destinatari o gli abbonati possono utilizzare questi dati direttamente con altri. Servizi AWS
Per creare, visualizzare, aggiornare o eliminare set di dati, i provider possono utilizzare la AWS Data Exchange console AWS CLI, il proprio REST client o uno dei. AWS SDKs Per ulteriori informazioni sulla gestione programmatica AWS Data Exchange dei set di dati, consulta la AWS Data Exchange API Guida di riferimento.
Argomenti
Set di dati di proprietà
Un set di dati è di proprietà dell'account che lo ha creato. I set di dati di proprietà possono essere identificati utilizzando il origin
parametro, che è impostato suOWNED
.
Set di dati autorizzati
I set di dati autorizzati sono una visualizzazione in sola lettura dei set di dati di proprietà del mittente. I set di dati autorizzati vengono creati al momento della creazione della concessione di dati o della pubblicazione del prodotto e sono messi a disposizione dei destinatari o degli abbonati che dispongono di una concessione di dati attiva o di un abbonamento al prodotto. I set di dati autorizzati possono essere identificati utilizzando il origin
parametro, che è impostato su. ENTITLED
In qualità di destinatario, puoi visualizzare e interagire con i set di dati autorizzati utilizzando AWS Data Exchange API o nella AWS Data Exchange console.
In qualità di proprietario del set di dati, hai anche accesso alla visualizzazione del set di dati autorizzata visualizzata dai tuoi destinatari o abbonati. Puoi farlo utilizzando o scegliendo il AWS Data Exchange API nome del set di dati nella concessione dei dati o nella pagina del prodotto nella AWS Data Exchange console.
Tipi di set di dati
I seguenti tipi di set di dati sono supportati in AWS Data Exchange:
File, set di dati
Un set di dati Files è un set di dati che contiene file flat consentiti da Amazon S3.
In qualità di destinatario o abbonato, puoi esportare i dati localmente (scaricarli sul tuo computer) o nel tuo bucket Amazon S3.
In qualità di proprietario del set di dati, puoi importare qualsiasi tipo di file flat dal tuo bucket Amazon S3 e aggiungerlo al set di dati.
APIset di dati
Un set di API dati è un set di dati che contiene API risorse. APIle risorse consentono ai destinatari o agli abbonati di effettuare API chiamate verso endpoint AWS Data Exchange gestiti, che vengono poi inoltrate tramite proxy agli endpoint del proprietario del set di dati.
In qualità di proprietario di un set di dati, ne crei uno API in Amazon API Gateway e lo aggiungi al set di dati per concedere in licenza l'accesso al tuo al API momento della creazione o della sottoscrizione di una concessione di dati.
Set di dati Amazon Redshift
Un set di dati Amazon Redshift include AWS Data Exchange datashare per Amazon Redshift. Quando ti abboni a un set di dati con datashare, vieni aggiunto come consumatore del datashare. Ciò consente l'accesso in sola lettura agli schemi, alle tabelle, alle viste e alle funzioni definite dall'utente che il proprietario del set di dati ha aggiunto alle condivisioni di dati.
In qualità di proprietario di un set di dati, puoi creare un database dal datashare in Amazon Redshift e quindi interrogare i dati in tempo reale senza estrarre, trasformare e caricare file. Ti viene automaticamente concesso l'accesso al datashare quando la concessione o l'abbonamento ai dati vengono attivati e perdi l'accesso dopo la scadenza di uno di questi.
In qualità di proprietario di un set di dati, crei un datashare in Amazon Redshift e lo aggiungi al set di dati per concedere in licenza l'accesso al tuo datashare al momento della creazione o della sottoscrizione di una concessione di dati.
Set di dati di accesso ai dati Amazon S3
Grazie all'accesso AWS Data Exchange ai dati di Amazon S3, i destinatari dei dati o gli abbonati possono accedere ai file di dati di terze parti direttamente dai bucket Amazon S3 dei proprietari dei set di dati.
Quando ti abboni a un prodotto di accesso ai dati AWS Data Exchange per Amazon S3, esegue AWS Data Exchange automaticamente le seguenti operazioni:
-
Esegue il provisioning di un punto di accesso Amazon S3. Amazon S3 Access Point è una funzionalità di Amazon S3 che semplifica la condivisione dei dati su un bucket Amazon S3.
-
Aggiorna le politiche relative alle risorse di S3 Access Point per garantirti l'accesso in sola lettura.
Con AWS Data Exchange Amazon S3, i proprietari di set di dati possono condividere l'accesso diretto a un intero bucket Amazon S3 o a prefissi specifici e oggetti Amazon S3. Inoltre, AWS Data Exchange può essere utilizzato per gestire automaticamente le concessioni di dati, gli abbonamenti, i diritti, la fatturazione e i pagamenti.
AWS Lake Formation set di dati (anteprima)
Un set di AWS Lake Formation dati è un set di dati che contiene risorse di autorizzazione AWS Lake Formation dei dati.
In qualità di destinatario o abbonato dei dati, puoi gestire i dati messi a tua disposizione nel tuo AWS Lake Formation. Dopo aver creato i link alle risorse nel tuo AWS Lake Formation, puoi interrogare i dati utilizzando servizi di analisi come Amazon Athena.
In qualità di proprietario di un set di dati, tagghi i tuoi dati utilizzando i tag LF AWS Lake Formation e li importi come risorse durante la creazione del set di dati.
Regioni AWS e set di dati
I set di dati possono essere inclusi in qualsiasi formato supportato Regione AWS, ma tutti i set di dati di una singola concessione di dati o prodotto devono appartenere allo stesso Regione AWS.
Struttura del set di dati
I set di dati hanno i seguenti parametri:
-
Name
— Il nome del set di dati. Questo valore può contenere fino a 256 caratteri. -
Description
— Una descrizione per il set di dati. Questo valore può contenere fino a 16.348 caratteri. -
AssetType
— Definisce il tipo di risorse contenute nel set di dati. -
Origin
— Una proprietà che definisce il setOwned
di dati assegnato all'account (per i fornitori) oEntitled
all'account (per gli abbonati). -
Id
— Un ID che identifica in modo univoco il set di dati. I set di dati IDs vengono generati al momento della creazione del set di dati. I set di dati autorizzati hanno un ID diverso rispetto al set di dati di proprietà originale. -
Arn
— Un identificatore univoco per il nome di una AWS risorsa. -
CreatedAt
eUpdatedAt
— Data e ora per la creazione e l'ultimo aggiornamento del set di dati.
Nota
In qualità di proprietario del set di dati, puoi modificare alcune proprietà dei set di dati di proprietà, come il nome o la descrizione. L'aggiornamento delle proprietà in un set di dati di proprietà non aggiornerà le proprietà nel corrispondente set di dati autorizzato.
Esempio risorsa del set di dati
{ "Origin": "OWNED", "AssetType": "S3_SNAPSHOT", "Name": "
MyDataSetName
", "CreatedAt": "2019-09-09T19:31:49.704Z", "UpdatedAt": "2019-09-09T19:31:49.704Z", "Id": "fEXAMPLE1fd9a5c8b0d2e6fEXAMPLEe1
", "Arn": "arn:aws:dataexchange:us-east-2:123456789109
:data-sets/fEXAMPLE1fd9a5c8b0d2e6fEXAMPLEe1
", "Description": "This is my data set's description that describes the contents of the data set.
" }
Le migliori pratiche relative ai set di dati
In qualità di proprietario di un set di dati, quando crei e aggiorni set di dati, tieni presente le seguenti best practice:
-
Il nome del set di dati è visibile nella concessione dei dati o nei dettagli del prodotto nel catalogo. Ti consigliamo di scegliere un nome conciso e descrittivo in modo che i clienti comprendano facilmente il contenuto del set di dati.
-
La descrizione è visibile ai destinatari o agli abbonati che dispongono di una concessione di dati attiva o di un abbonamento al prodotto. Ti consigliamo di includere informazioni sulla copertura e le caratteristiche e i vantaggi del set di dati.
Tag
Puoi aggiungere tag ai set di dati di tua proprietà e alle relative revisioni. Quando utilizzi i tag, puoi anche utilizzare il controllo dell'accesso basato su tag nelle politiche AWS Identity and Access Management (IAM) per controllare l'accesso a questi set di dati e alle revisioni.
I set di dati autorizzati non possono essere etichettati. I tag dei set di dati di proprietà e le relative revisioni non vengono propagati alle corrispondenti versioni autorizzate. In particolare, i destinatari o gli abbonati, che hanno accesso in sola lettura ai set di dati e alle revisioni autorizzati, non vedranno i tag del set di dati di proprietà originale.
Nota
Attualmente, le risorse e le offerte di lavoro non supportano il tagging.