Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Traitement via CLI
Traitez votre premier document via CLI
Entrez des fichiers dans un compartiment S3
Avant de traiter des documents avec BDA, vous devez d'abord les télécharger dans un compartiment S3 :
Syntaxe
aws s3 cp <source> <target> [--options]
Exemple :
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
Structure de commande de traitement de base
Utilisez la invoke-data-automation-async
commande pour traiter les fichiers :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Structure de commande de traitement avancée
Traitement vidéo avec segments temporels
Pour les fichiers vidéo, vous pouvez définir les segments temporels à traiter :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Utilisation de plans personnalisés
Vous pouvez spécifier des plans personnalisés directement dans la commande :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Ajout d'une configuration de chiffrement
Pour améliorer la sécurité, vous pouvez ajouter une configuration de chiffrement :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Notifications d’événements
Activez EventBridge les notifications pour la fin du traitement :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
Vérification de l'état du traitement
Utilisez la get-data-automation-status
commande pour vérifier l'état de votre tâche de traitement :
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
La réponse inclura le statut actuel :
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
Récupérez les résultats du traitement
Localisation des fichiers de sortie dans S3
Répertoriez les fichiers de sortie dans votre compartiment S3 :
aws s3 ls s3://amzn-s3-demo-bucket/output/
Téléchargez les résultats sur votre ordinateur local :
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
Comprendre la structure de sortie
La sortie inclut généralement :
-
standard-output.json
: contient les résultats d'extraction standard -
custom-output.json
: contient les résultats de plans personnalisés -
metadata.json
: contient des métadonnées de traitement et des scores de confiance
Champs de réponse courants
La sortie standard inclut généralement :
-
extractedData
: Les principales informations extraites -
confidence
: scores de confiance pour chaque champ extrait -
metadata
: Informations de traitement, y compris les horodatages et les détails du modèle -
boundingBoxes
: informations de localisation pour les éléments détectés (si activé)
Gestion des erreurs et résolution des problèmes
Scénarios d'erreur courants et solutions :
-
URI S3 non valide : assurez-vous que votre compartiment S3 existe et que vous disposez des autorisations appropriées
-
data-automation-profile-arnManquant : ce paramètre est obligatoire pour toutes les demandes de traitement
-
Projet introuvable : vérifiez que l'ARN de votre projet est correct et que le projet existe
-
Format de fichier non pris en charge : Vérifiez que votre format de fichier est pris en charge par BDA
Ajout de balises aux tâches de traitement
Vous pouvez ajouter des balises pour vous aider à organiser et à suivre vos tâches de traitement :
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"