Étape 1 : ajout de documents à Amazon S3 - Amazon Kendra

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Étape 1 : ajout de documents à Amazon S3

Avant d'exécuter une tâche d'analyse des entités Amazon Comprehend sur votre ensemble de données, vous devez créer un compartiment Amazon S3 pour héberger les données, les métadonnées et les résultats de l'analyse des entités Amazon Comprehend.

Téléchargement de l'exemple de jeu de données

Avant qu'Amazon Comprehend puisse exécuter une tâche d'analyse d'entités sur vos données, vous devez télécharger et extraire le jeu de données, puis le charger dans un compartiment S3.

  1. Téléchargez le dossier tutorial-dataset.zip sur votre appareil.

  2. Extrayez le tutorial-dataset dossier pour y accéder. data

  1. Pour le téléchargertutorial-dataset, exécutez la commande suivante dans une fenêtre de terminal :

    Linux
    curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip

    Où :

    • path/ est le chemin du fichier local vers l'emplacement dans lequel vous souhaitez enregistrer le dossier zip.

    macOS
    curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip

    Où :

    • path/ est le chemin du fichier local vers l'emplacement dans lequel vous souhaitez enregistrer le dossier zip.

    Windows
    curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip

    Où :

    • path/ est le chemin du fichier local vers l'emplacement dans lequel vous souhaitez enregistrer le dossier zip.

  2. Pour extraire les données du dossier zip, exécutez la commande suivante dans la fenêtre du terminal :

    Linux
    unzip path/tutorial-dataset.zip -d path/

    Où :

    • path/ est le chemin de fichier local vers le dossier zip que vous avez enregistré.

    macOS
    unzip path/tutorial-dataset.zip -d path/

    Où :

    • path/ est le chemin de fichier local vers le dossier zip que vous avez enregistré.

    Windows
    tar -xf path/tutorial-dataset.zip -C path/

    Où :

    • path/ est le chemin de fichier local vers le dossier zip que vous avez enregistré.

À la fin de cette étape, vous devriez avoir les fichiers extraits dans un dossier décompressé appelétutorial-dataset. Ce dossier contient un README fichier avec une attribution open source Apache 2.0 et un dossier appelé data contenant le jeu de données pour ce didacticiel. Le jeu de données comprend 100 fichiers avec des .story extensions.

Création d'un compartiment Amazon S3

Après avoir téléchargé et extrait le dossier de données d'exemple, vous le stockez dans un compartiment Amazon S3.

Important

Le nom d'un compartiment Amazon S3 doit être unique dans tous les compartiments AWS.

  1. Connectez-vous à la console Amazon S3 AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/s3/.

  2. Dans Buckets, choisissez Create bucket.

  3. Pour Nom de compartiment, entrez un nom unique.

  4. Pour Région, choisissez la AWS région dans laquelle vous souhaitez créer le bucket.

    Note

    Vous devez choisir une région qui prend en charge à la fois Amazon Comprehend et Amazon Kendra. Vous ne pouvez pas modifier la région d'un bucket après l'avoir créé.

  5. Conservez les paramètres par défaut pour les paramètres de blocage de l'accès public pour ce compartiment, le contrôle de version du compartiment et les balises.

  6. Pour le chiffrement par défaut, choisissez Désactiver.

  7. Conservez les paramètres par défaut pour les paramètres avancés.

  8. Vérifiez la configuration de votre compartiment, puis choisissez Create bucket.

  1. Pour créer un compartiment S3, utilisez la commande create-bucket dans le : AWS CLI

    Linux
    aws s3api create-bucket \ --bucket amzn-s3-demo-bucket \ --region aws-region \ --create-bucket-configuration LocationConstraint=aws-region

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket,

    • aws-region est la région dans laquelle vous souhaitez créer votre bucket.

    macOS
    aws s3api create-bucket \ --bucket amzn-s3-demo-bucket \ --region aws-region \ --create-bucket-configuration LocationConstraint=aws-region

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket,

    • aws-region est la région dans laquelle vous souhaitez créer votre bucket.

    Windows
    aws s3api create-bucket ^ --bucket amzn-s3-demo-bucket ^ --region aws-region ^ --create-bucket-configuration LocationConstraint=aws-region

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket,

    • aws-region est la région dans laquelle vous souhaitez créer votre bucket.

    Note

    Vous devez choisir une région qui prend en charge à la fois Amazon Comprehend et Amazon Kendra. Vous ne pouvez pas modifier la région d'un bucket après l'avoir créé.

  2. Pour vous assurer que votre bucket a été créé avec succès, utilisez la commande list :

    Linux
    aws s3 ls
    macOS
    aws s3 ls
    Windows
    aws s3 ls

Création de dossiers de données et de métadonnées dans votre compartiment S3

Après avoir créé votre compartiment S3, vous créez des dossiers de données et de métadonnées à l'intérieur de celui-ci.

  1. Ouvrez la console Amazon S3 à l'adresse https://console.aws.amazon.com/s3/.

  2. Dans Buckets, cliquez sur le nom de votre bucket dans la liste des buckets.

  3. Dans l'onglet Objets, choisissez Créer un dossier.

  4. Pour le nouveau nom du dossier, entrezdata.

  5. Pour les paramètres de chiffrement, choisissez Désactiver.

  6. Choisissez Créer un dossier.

  7. Répétez les étapes 3 à 6 pour créer un autre dossier destiné à stocker les métadonnées Amazon Kendra et nommez le dossier créé à l'étape 4. metadata

  1. Pour créer le data dossier dans votre compartiment S3, utilisez la commande put-object dans : AWS CLI

    Linux
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key data/

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket.

    macOS
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key data/

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket.

    Windows
    aws s3api put-object ^ --bucket amzn-s3-demo-bucket ^ --key data/

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket.

  2. Pour créer le metadata dossier dans votre compartiment S3, utilisez la commande put-object dans : AWS CLI

    Linux
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key metadata/

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket.

    macOS
    aws s3api put-object \ --bucket amzn-s3-demo-bucket \ --key metadata/

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket.

    Windows
    aws s3api put-object ^ --bucket amzn-s3-demo-bucket ^ --key metadata/

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket.

  3. Pour vous assurer que vos dossiers ont été créés correctement, vérifiez le contenu de votre bucket à l'aide de la commande list :

    Linux
    aws s3 ls s3://amzn-s3-demo-bucket/

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket.

    macOS
    aws s3 ls s3://amzn-s3-demo-bucket/

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket.

    Windows
    aws s3 ls s3://amzn-s3-demo-bucket/

    Où :

    • amzn-s3-demo-bucket est le nom de votre bucket.

Téléchargement des données d'entrée

Après avoir créé vos dossiers de données et de métadonnées, vous chargez l'exemple de jeu de données dans le data dossier.

  1. Ouvrez la console Amazon S3 à l'adresse https://console.aws.amazon.com/s3/.

  2. Dans Buckets, cliquez sur le nom de votre bucket dans la liste des buckets, puis cliquez sur. data

  3. Choisissez Télécharger, puis Ajouter des fichiers.

  4. Dans la boîte de dialogue, accédez au data dossier situé dans le tutorial-dataset dossier de votre appareil local, sélectionnez tous les fichiers, puis choisissez Ouvrir.

  5. Conservez les paramètres par défaut pour la destination, les autorisations et les propriétés.

  6. Sélectionnez Charger.

  1. Pour télécharger les exemples de données dans le data dossier, utilisez la commande de copie dans AWS CLI :

    Linux
    aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive

    Où :

    • path/ est le chemin d'accès au tutorial-dataset dossier sur votre appareil,

    • amzn-s3-demo-bucket est le nom de votre bucket.

    macOS
    aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive

    Où :

    • path/ est le chemin d'accès au tutorial-dataset dossier sur votre appareil,

    • amzn-s3-demo-bucket est le nom de votre bucket.

    Windows
    aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive

    Où :

    • path/ est le chemin d'accès au tutorial-dataset dossier sur votre appareil,

    • amzn-s3-demo-bucket est le nom de votre bucket.

  2. Pour vous assurer que les fichiers de votre ensemble de données ont été correctement chargés data dans votre dossier, utilisez la commande list dans le AWS CLI :

    Linux
    aws s3 ls s3://amzn-s3-demo-bucket/data/

    Où :

    • amzn-s3-demo-bucket est le nom de votre compartiment S3.

    macOS
    aws s3 ls s3://amzn-s3-demo-bucket/data/

    Où :

    • amzn-s3-demo-bucket est le nom de votre compartiment S3.

    Windows
    aws s3 ls s3://amzn-s3-demo-bucket/data/

    Où :

    • amzn-s3-demo-bucket est le nom de votre compartiment S3.

À la fin de cette étape, vous disposez d'un compartiment S3 dans lequel votre ensemble de données est stocké data dans le dossier, et d'un metadata dossier vide dans lequel seront stockées vos métadonnées Amazon Kendra.