Fase 1: aggiunta di documenti ad Amazon S3 - Amazon Kendra

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Fase 1: aggiunta di documenti ad Amazon S3

Prima di eseguire un processo di analisi delle entità Amazon Comprehend sul tuo set di dati, crei un bucket Amazon S3 per ospitare i dati, i metadati e l'output di analisi delle entità Amazon Comprehend.

Scaricamento del set di dati di esempio

Prima che Amazon Comprehend possa eseguire un processo di analisi delle entità sui tuoi dati, devi scaricare ed estrarre il set di dati e caricarlo in un bucket S3.

  1. Scarica la cartella tutorial-dataset.zip sul tuo dispositivo.

  2. Estrai la tutorial-dataset cartella per accedervi. data

  1. Per scaricare iltutorial-dataset, esegui il seguente comando in una finestra di terminale:

    Linux
    curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip

    Dove:

    • path/ è il percorso locale del file nella posizione in cui si desidera salvare la cartella zip.

    macOS
    curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip

    Dove:

    • path/ è il percorso del file locale della posizione in cui si desidera salvare la cartella zip.

    Windows
    curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip

    Dove:

    • path/ è il percorso del file locale della posizione in cui si desidera salvare la cartella zip.

  2. Per estrarre i dati dalla cartella zip, esegui il seguente comando nella finestra del terminale:

    Linux
    unzip path/tutorial-dataset.zip -d path/

    Dove:

    • path/ è il percorso locale del file alla cartella zip salvata.

    macOS
    unzip path/tutorial-dataset.zip -d path/

    Dove:

    • path/ è il percorso del file locale della cartella zip salvata.

    Windows
    tar -xf path/tutorial-dataset.zip -C path/

    Dove:

    • path/ è il percorso del file locale della cartella zip salvata.

Alla fine di questo passaggio, dovresti avere i file estratti in una cartella decompressa chiamata. tutorial-dataset Questa cartella contiene un README file con un'attribuzione open source Apache 2.0 e una cartella chiamata data contenente il set di dati per questo tutorial. Il set di dati è composto da 100 file con estensioni. .story

Creazione di un bucket Amazon S3

Dopo aver scaricato ed estratto la cartella dei dati di esempio, la memorizzi in un bucket Amazon S3.

Importante

Il nome di un bucket Amazon S3 deve essere univoco per tutti. AWS

  1. Accedi a AWS Management Console e apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/

  2. In Bucket, scegli Crea bucket.

  3. In Bucket name (Nome bucket), immettere un nome univoco.

  4. Per Regione, scegli la AWS regione in cui desideri creare il bucket.

    Nota

    Devi scegliere una regione che supporti sia Amazon Comprehend che Amazon Kendra. Non è possibile modificare la regione di un bucket dopo averlo creato.

  5. Mantieni le impostazioni predefinite per le impostazioni di Block Public Access per questo bucket, Bucket Versioning e Tag.

  6. Per Crittografia predefinita, scegli Disabilita.

  7. Mantieni le impostazioni predefinite per le impostazioni avanzate.

  8. Controlla la configurazione del bucket, quindi scegli Crea bucket.

  1. Per creare un bucket S3, usa il comando create-bucket in: AWS CLI

    Linux
    aws s3api create-bucket \ --bucket amzn-s3-demo-bucket \ --region aws-region \ --create-bucket-configuration LocationConstraint=aws-region

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket,

    • aws-region è la regione in cui vuoi creare il tuo bucket.

    macOS
    aws s3api create-bucket \ --bucket amzn-s3-demo-bucket \ --region aws-region \ --create-bucket-configuration LocationConstraint=aws-region

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket,

    • aws-region è la regione in cui vuoi creare il tuo bucket.

    Windows
    aws s3api create-bucket ^ --bucket amzn-s3-demo-bucket ^ --region aws-region ^ --create-bucket-configuration LocationConstraint=aws-region

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket,

    • aws-region è la regione in cui vuoi creare il tuo bucket.

    Nota

    Devi scegliere una regione che supporti sia Amazon Comprehend che Amazon Kendra. Non è possibile modificare la regione di un bucket dopo averlo creato.

  2. Per assicurarti che il tuo bucket sia stato creato correttamente, usa il comando list:

    Linux
    aws s3 ls
    macOS
    aws s3 ls
    Windows
    aws s3 ls

Creazione di cartelle di dati e metadati nel bucket S3

Dopo aver creato il bucket S3, crei cartelle di dati e metadati al suo interno.

  1. Apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/

  2. In Bucket, fai clic sul nome del tuo bucket dall'elenco dei bucket.

  3. Dalla scheda Oggetti, scegli Crea cartella.

  4. Per il nuovo nome della cartella, immettetedata.

  5. Per le impostazioni di crittografia, scegliete Disabilita.

  6. Scegliere Create folder (Crea cartella).

  7. Ripeti i passaggi da 3 a 6 per creare un'altra cartella per l'archiviazione dei metadati di Amazon Kendra e assegna un nome alla cartella creata nel passaggio 4. metadata

  1. Per creare la data cartella nel tuo bucket S3, usa il comando put-object in: AWS CLI

    Linux
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key data/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket.

    macOS
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key data/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket.

    Windows
    aws s3api put-object ^ --bucket amzn-s3-demo-bucket ^ --key data/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket.

  2. Per creare la metadata cartella nel tuo bucket S3, usa il comando put-object in: AWS CLI

    Linux
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key metadata/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket.

    macOS
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key metadata/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket.

    Windows
    aws s3api put-object ^ --bucket amzn-s3-demo-bucket ^ --key metadata/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket.

  3. Per assicurarti che le tue cartelle siano state create correttamente, controlla il contenuto del tuo bucket usando il comando list:

    Linux
    aws s3 ls s3://amzn-s3-demo-bucket/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket.

    macOS
    aws s3 ls s3://amzn-s3-demo-bucket/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket.

    Windows
    aws s3 ls s3://amzn-s3-demo-bucket/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket.

Caricamento dei dati di input

Dopo aver creato le cartelle di dati e metadati, carichi il set di dati di esempio nella cartella. data

  1. Apri la console Amazon S3 all'indirizzo. https://console.aws.amazon.com/s3/

  2. In Bucket, fai clic sul nome del tuo bucket dall'elenco dei bucket, quindi fai clic su. data

  3. Scegli Carica, quindi scegli Aggiungi file.

  4. Nella finestra di dialogo, accedi alla data cartella all'interno della tutorial-dataset cartella sul dispositivo locale, seleziona tutti i file, quindi scegli Apri.

  5. Mantieni le impostazioni predefinite per Destinazione, Autorizzazioni e Proprietà.

  6. Scegli Carica.

  1. Per caricare i dati di esempio nella data cartella, utilizzate il comando copy in: AWS CLI

    Linux
    aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive

    Dove:

    • path/ è il percorso del file alla tutorial-dataset cartella sul dispositivo,

    • amzn-s3-demo-bucket è il nome del tuo bucket.

    macOS
    aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive

    Dove:

    • path/ è il percorso del file alla cartella sul dispositivo, tutorial-dataset

    • amzn-s3-demo-bucket è il nome del tuo bucket.

    Windows
    aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive

    Dove:

    • path/ è il percorso del file alla cartella sul dispositivo, tutorial-dataset

    • amzn-s3-demo-bucket è il nome del tuo bucket.

  2. Per assicurarti che i file del set di dati siano stati caricati correttamente nella tua cartella, usa il comando list in: data AWS CLI

    Linux
    aws s3 ls s3://amzn-s3-demo-bucket/data/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket S3.

    macOS
    aws s3 ls s3://amzn-s3-demo-bucket/data/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket S3.

    Windows
    aws s3 ls s3://amzn-s3-demo-bucket/data/

    Dove:

    • amzn-s3-demo-bucket è il nome del tuo bucket S3.

Al termine di questo passaggio, avrai un bucket S3 con il set di dati archiviato all'interno della data cartella e una metadata cartella vuota, in cui verranno archiviati i metadati Amazon Kendra.