Traitement au moyen de la CLI - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Traitement au moyen de la CLI

Traitement de votre premier document au moyen de la CLI

Fichiers d’entrée dans un compartiment S3

Avant de traiter des documents avec BDA, vous devez d’abord les charger dans un compartiment S3 :

Syntaxe

aws s3 cp <source> <target> [--options]

Exemple :

aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf

Structure de commande de traitement de base

Traitez les fichiers à l’aide de la commande invoke-data-automation-async :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Structure de commande de traitement avancée

Traitement vidéo avec segments temporels

Pour les fichiers vidéo, vous pouvez spécifier les segments temporels à traiter :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Utilisation de plans personnalisés

Vous pouvez spécifier des plans personnalisés directement dans la commande :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Ajout d’une configuration de chiffrement

Pour renforcer la sécurité, vous pouvez ajouter une configuration de chiffrement :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Notifications d’événements

Activez les notifications EventBridge pour la fin du traitement :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Vérification du statut de traitement

Vérifiez le statut de votre tâche de traitement à l’aide de la commande get-data-automation-status :

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

La réponse inclut le statut actuel :

{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }

Récupération des résultats du traitement

Localisation des fichiers de sortie dans S3

Répertoriez les fichiers de sortie de votre compartiment S3 :

aws s3 ls s3://amzn-s3-demo-bucket/output/

Téléchargez les résultats sur votre ordinateur local :

aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive

Présentation de la structure de sortie

La sortie inclut généralement les éléments suivants :

  • standard-output.json : contient les résultats d’extraction standard

  • custom-output.json : contient les résultats de plans personnalisés

  • metadata.json : contient des métadonnées de traitement et des scores de confiance

Champs de réponse courants

La sortie standard inclut généralement les éléments suivants :

  • extractedData : principales informations extraites

  • confidence : scores de confiance pour chaque champ extrait

  • metadata : informations de traitement, y compris les horodatages et les détails du modèle

  • boundingBoxes : informations de localisation pour les éléments détectés (en cas d’activation)

Gestion des erreurs et résolution des problèmes

Scénarios d’erreur courants et solutions :

  • URI S3 non valide : assurez-vous que votre compartiment S3 existe et que vous disposez des autorisations appropriées.

  • data-automation-profile-arn manquant : ce paramètre est obligatoire pour toutes les demandes de traitement.

  • Projet introuvable : vérifiez que l’ARN de votre projet est correct et que le projet existe.

  • Format de fichier non pris en charge : vérifiez que votre format de fichier est pris en charge par BDA.

Ajout de balises aux tâches de traitement

Vous pouvez ajouter des balises pour vous aider à organiser et suivre vos tâches de traitement :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"