Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Fase 1: aggiunta di documenti ad Amazon S3
Prima di eseguire un processo di analisi delle entità Amazon Comprehend sul tuo set di dati, crei un bucket Amazon S3 per ospitare i dati, i metadati e l'output di analisi delle entità Amazon Comprehend.
Argomenti
Scaricamento del set di dati di esempio
Prima che Amazon Comprehend possa eseguire un processo di analisi delle entità sui tuoi dati, devi scaricare ed estrarre il set di dati e caricarlo in un bucket S3.
-
Scarica la cartella tutorial-dataset.zip sul tuo dispositivo.
-
Estrai la
tutorial-dataset
cartella per accedervi.data
-
Per scaricare il
tutorial-dataset
, esegui il seguente comando in una finestra di terminale: -
Per estrarre i dati dalla cartella zip, esegui il seguente comando nella finestra del terminale:
Alla fine di questo passaggio, dovresti avere i file estratti in una cartella decompressa chiamata. tutorial-dataset
Questa cartella contiene un README
file con un'attribuzione open source Apache 2.0 e una cartella chiamata data
contenente il set di dati per questo tutorial. Il set di dati è composto da 100 file con estensioni. .story
Creazione di un bucket Amazon S3
Dopo aver scaricato ed estratto la cartella dei dati di esempio, la memorizzi in un bucket Amazon S3.
Importante
Il nome di un bucket Amazon S3 deve essere univoco per tutti. AWS
Accedi a AWS Management Console e apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/
-
In Bucket, scegli Crea bucket.
-
In Bucket name (Nome bucket), immettere un nome univoco.
-
Per Regione, scegli la AWS regione in cui desideri creare il bucket.
Nota
Devi scegliere una regione che supporti sia Amazon Comprehend che Amazon Kendra. Non è possibile modificare la regione di un bucket dopo averlo creato.
-
Mantieni le impostazioni predefinite per le impostazioni di Block Public Access per questo bucket, Bucket Versioning e Tag.
-
Per Crittografia predefinita, scegli Disabilita.
-
Mantieni le impostazioni predefinite per le impostazioni avanzate.
-
Controlla la configurazione del bucket, quindi scegli Crea bucket.
-
Per creare un bucket S3, usa il comando create-bucket
in: AWS CLI Nota
Devi scegliere una regione che supporti sia Amazon Comprehend che Amazon Kendra. Non è possibile modificare la regione di un bucket dopo averlo creato.
-
Per assicurarti che il tuo bucket sia stato creato correttamente, usa il comando list
:
Creazione di cartelle di dati e metadati nel bucket S3
Dopo aver creato il bucket S3, crei cartelle di dati e metadati al suo interno.
Apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/
-
In Bucket, fai clic sul nome del tuo bucket dall'elenco dei bucket.
-
Dalla scheda Oggetti, scegli Crea cartella.
-
Per il nuovo nome della cartella, immettete
data
. -
Per le impostazioni di crittografia, scegliete Disabilita.
-
Scegliere Create folder (Crea cartella).
-
Ripeti i passaggi da 3 a 6 per creare un'altra cartella per l'archiviazione dei metadati di Amazon Kendra e assegna un nome alla cartella creata nel passaggio 4.
metadata
-
Per creare la
data
cartella nel tuo bucket S3, usa il comando put-objectin: AWS CLI -
Per creare la
metadata
cartella nel tuo bucket S3, usa il comando put-object in:AWS CLI -
Caricamento dei dati di input
Dopo aver creato le cartelle di dati e metadati, carichi il set di dati di esempio nella cartella. data
Apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/
-
In Bucket, fai clic sul nome del tuo bucket dall'elenco dei bucket, quindi fai clic su.
data
-
Scegli Carica, quindi scegli Aggiungi file.
-
Nella finestra di dialogo, accedi alla
data
cartella all'interno dellatutorial-dataset
cartella sul dispositivo locale, seleziona tutti i file, quindi scegli Apri. -
Mantieni le impostazioni predefinite per Destinazione, Autorizzazioni e Proprietà.
-
Scegli Carica.
-
Per caricare i dati di esempio nella
data
cartella, utilizzate il comando copyin: AWS CLI -
Al termine di questo passaggio, avrai un bucket S3 con il set di dati archiviato all'interno della data
cartella e una metadata
cartella vuota, in cui verranno archiviati i metadati Amazon Kendra.