Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Traitement au moyen de la CLI
Traitement de votre premier document au moyen de la CLI
Fichiers d’entrée dans un compartiment S3
Avant de traiter des documents avec BDA, vous devez d’abord les charger dans un compartiment S3 :
Syntaxe
aws s3 cp <source> <target> [--options]
Exemple :
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Structure de commande de traitement de base
Traitez les fichiers à l’aide de la commande invoke-data-automation-async :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Structure de commande de traitement avancée
Traitement vidéo avec segments temporels
Pour les fichiers vidéo, vous pouvez spécifier les segments temporels à traiter :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Utilisation de plans personnalisés
Vous pouvez spécifier des plans personnalisés directement dans la commande :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Ajout d’une configuration de chiffrement
Pour renforcer la sécurité, vous pouvez ajouter une configuration de chiffrement :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Notifications d’événements
Activez les notifications EventBridge pour la fin du traitement :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Vérification du statut de traitement
Vérifiez le statut de votre tâche de traitement à l’aide de la commande get-data-automation-status :
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
La réponse inclut le statut actuel :
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
Récupération des résultats du traitement
Localisation des fichiers de sortie dans S3
Répertoriez les fichiers de sortie de votre compartiment S3 :
aws s3 ls s3://amzn-s3-demo-bucket/output/
Téléchargez les résultats sur votre ordinateur local :
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
Présentation de la structure de sortie
La sortie inclut généralement les éléments suivants :
-
standard-output.json: contient les résultats d’extraction standard -
custom-output.json: contient les résultats de plans personnalisés -
metadata.json: contient des métadonnées de traitement et des scores de confiance
Champs de réponse courants
La sortie standard inclut généralement les éléments suivants :
-
extractedData: principales informations extraites -
confidence: scores de confiance pour chaque champ extrait -
metadata: informations de traitement, y compris les horodatages et les détails du modèle -
boundingBoxes: informations de localisation pour les éléments détectés (en cas d’activation)
Gestion des erreurs et résolution des problèmes
Scénarios d’erreur courants et solutions :
-
URI S3 non valide : assurez-vous que votre compartiment S3 existe et que vous disposez des autorisations appropriées.
-
data-automation-profile-arn manquant : ce paramètre est obligatoire pour toutes les demandes de traitement.
-
Projet introuvable : vérifiez que l’ARN de votre projet est correct et que le projet existe.
-
Format de fichier non pris en charge : vérifiez que votre format de fichier est pris en charge par BDA.
Ajout de balises aux tâches de traitement
Vous pouvez ajouter des balises pour vous aider à organiser et suivre vos tâches de traitement :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"