Configurare una posizione per l'output del cluster Amazon EMR - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Configurare una posizione per l'output del cluster Amazon EMR

Il formato di output più comune di un cluster Amazon EMR sono i file di testo, compressi o decompressi. Di solito, tali file vengono scritti su un bucket Amazon S3. Occorre creare questo bucket prima dell'avvio del cluster. Specifica il bucket S3 come percorso di output al momento dell'avvio del cluster.

Per ulteriori informazioni, consulta i seguenti argomenti:

Creazione e configurazione di un bucket Amazon S3

Amazon EMR usa Amazon S3 per archiviare dati di input, file di log e dati di output. Amazon S3 fa riferimento a questi percorsi di archiviazione come bucket. I bucket presentano determinate restrizioni e limitazioni in conformità con i requisiti di Amazon S3 e DNS. Per ulteriori informazioni, consulta Restrizioni e limitazioni dei bucket nella Guida per gli sviluppatori di Amazon Simple Storage Service.

Per creare un bucket Amazon S3, segui le istruzioni nella pagina Creazione di un bucket della Guida per gli sviluppatori di Amazon Simple Storage Service.

Nota

Se abiliti la registrazione nella procedura guidata Create a Bucket (Crea un bucket), sono abilitati solo i log di accesso al bucket e non i log del cluster.

Nota

Per ulteriori informazioni sulla specificazione di bucket specifici per regione, consulta Bucket e regioni nella Amazon Simple Storage Service Developer Guide and Available Region Endpoints per. AWS SDKs

Dopo aver creato il bucket è possibile impostare le autorizzazioni appropriate su di esso. In genere, consenti a te stesso (il proprietario) l'accesso in lettura e scrittura. Si consiglia di seguire Best practice di sicurezza per Amazon S3 durante la configurazione del bucket.

Per poter creare un cluster, sono necessari i bucket Amazon S3 richiesti. È necessario caricare in Amazon S3 tutti gli script e i dati a cui viene fatto riferimento nel cluster. Nella seguente tabella vengono descritti dati, script e ubicazioni di file di log esempio.

Informazioni Esempio di percorso su Amazon S3
script o programma s3://amzn-s3-demo-bucket1/script/MapperScript.py
file di log s3://amzn-s3-demo-bucket1/logs
dati di input s3://amzn-s3-demo-bucket1/input
dati di output s3://amzn-s3-demo-bucket1/output