Traitement via CLI - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Traitement via CLI

Traitez votre premier document via CLI

Entrez des fichiers dans un compartiment S3

Avant de traiter des documents avec BDA, vous devez d'abord les télécharger dans un compartiment S3 :

Syntaxe

aws s3 cp <source> <target> [--options]

Exemple :

aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf

Structure de commande de traitement de base

Utilisez la invoke-data-automation-async commande pour traiter les fichiers :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Structure de commande de traitement avancée

Traitement vidéo avec segments temporels

Pour les fichiers vidéo, vous pouvez définir les segments temporels à traiter :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Utilisation de plans personnalisés

Vous pouvez spécifier des plans personnalisés directement dans la commande :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Ajout d'une configuration de chiffrement

Pour améliorer la sécurité, vous pouvez ajouter une configuration de chiffrement :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Notifications d’événements

Activez EventBridge les notifications pour la fin du traitement :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

Vérification de l'état du traitement

Utilisez la get-data-automation-status commande pour vérifier l'état de votre tâche de traitement :

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

La réponse inclura le statut actuel :

{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }

Récupérez les résultats du traitement

Localisation des fichiers de sortie dans S3

Répertoriez les fichiers de sortie dans votre compartiment S3 :

aws s3 ls s3://amzn-s3-demo-bucket/output/

Téléchargez les résultats sur votre ordinateur local :

aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive

Comprendre la structure de sortie

La sortie inclut généralement :

  • standard-output.json: contient les résultats d'extraction standard

  • custom-output.json: contient les résultats de plans personnalisés

  • metadata.json: contient des métadonnées de traitement et des scores de confiance

Champs de réponse courants

La sortie standard inclut généralement :

  • extractedData: Les principales informations extraites

  • confidence: scores de confiance pour chaque champ extrait

  • metadata: Informations de traitement, y compris les horodatages et les détails du modèle

  • boundingBoxes: informations de localisation pour les éléments détectés (si activé)

Gestion des erreurs et résolution des problèmes

Scénarios d'erreur courants et solutions :

  • URI S3 non valide : assurez-vous que votre compartiment S3 existe et que vous disposez des autorisations appropriées

  • data-automation-profile-arnManquant : ce paramètre est obligatoire pour toutes les demandes de traitement

  • Projet introuvable : vérifiez que l'ARN de votre projet est correct et que le projet existe

  • Format de fichier non pris en charge : Vérifiez que votre format de fichier est pris en charge par BDA

Ajout de balises aux tâches de traitement

Vous pouvez ajouter des balises pour vous aider à organiser et à suivre vos tâches de traitement :

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"