Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Configurare una posizione per l'output del cluster Amazon EMR
Il formato di output più comune di un cluster Amazon EMR sono i file di testo, compressi o decompressi. Di solito, tali file vengono scritti su un bucket Amazon S3. Occorre creare questo bucket prima dell'avvio del cluster. Specifica il bucket S3 come percorso di output al momento dell'avvio del cluster.
Per ulteriori informazioni, consulta i seguenti argomenti:
Argomenti
Creazione e configurazione di un bucket Amazon S3
Amazon EMR usa Amazon S3 per archiviare dati di input, file di log e dati di output. Amazon S3 fa riferimento a questi percorsi di archiviazione come bucket. I bucket presentano determinate restrizioni e limitazioni in conformità con i requisiti di Amazon S3 e DNS. Per ulteriori informazioni, consulta Restrizioni e limitazioni dei bucket nella Guida per gli sviluppatori di Amazon Simple Storage Service.
Per creare un bucket Amazon S3, segui le istruzioni nella pagina Creazione di un bucket della Guida per gli sviluppatori di Amazon Simple Storage Service.
Nota
Se abiliti la registrazione nella procedura guidata Create a Bucket (Crea un bucket), sono abilitati solo i log di accesso al bucket e non i log del cluster.
Nota
Per ulteriori informazioni sulla specificazione di bucket specifici per regione, consulta Bucket e regioni nella Amazon Simple Storage Service Developer Guide and Available
Dopo aver creato il bucket è possibile impostare le autorizzazioni appropriate su di esso. In genere, consenti a te stesso (il proprietario) l'accesso in lettura e scrittura. Si consiglia di seguire Best practice di sicurezza per Amazon S3 durante la configurazione del bucket.
Per poter creare un cluster, sono necessari i bucket Amazon S3 richiesti. È necessario caricare in Amazon S3 tutti gli script e i dati a cui viene fatto riferimento nel cluster. Nella seguente tabella vengono descritti dati, script e ubicazioni di file di log esempio.
Informazioni | Esempio di percorso su Amazon S3 |
---|---|
script o programma |
s3://amzn-s3-demo-bucket1/script/MapperScript.py
|
file di log |
s3://amzn-s3-demo-bucket1/logs
|
dati di input |
s3://amzn-s3-demo-bucket1/input
|
dati di output |
s3://amzn-s3-demo-bucket1/output
|