기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
CLI를 통한 처리
CLI를 통해 첫 번째 문서 처리
S3 버킷에 파일 입력
BDA로 문서를 처리하기 전에 먼저 S3 버킷에 문서를 업로드해야 합니다.
구문
aws s3 cp <source> <target> [--options]
예시
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
기본 처리 명령 구조
invoke-data-automation-async
명령을 사용하여 파일을 처리합니다.
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
고급 처리 명령 구조
시간 세그먼트를 사용한 비디오 처리
비디오 파일의 경우 처리할 시간 세그먼트를 지정할 수 있습니다.
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
사용자 지정 블루프린트 사용
명령에서 직접 사용자 지정 블루프린트를 지정할 수 있습니다.
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
암호화 구성 추가
보안 강화를 위해 암호화 구성을 추가할 수 있습니다.
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
이벤트 알림
처리 완료를 위해 EventBridge 알림 활성화:
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"
처리 상태 확인
get-data-automation-status
명령을 사용하여 처리 작업의 상태를 확인합니다.
aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"
응답에는 현재 상태가 포함됩니다.
{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }
처리 결과 검색
S3에서 출력 파일 찾기
S3 버킷의 출력 파일을 나열합니다.
aws s3 ls s3://amzn-s3-demo-bucket/output/
결과를 로컬 시스템에 다운로드합니다.
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
출력 구조 이해
출력에는 일반적으로 다음이 포함됩니다.
-
standard-output.json
: 표준 추출 결과 포함 -
custom-output.json
: 사용자 지정 블루프린트의 결과를 포함합니다. -
metadata.json
: 처리 메타데이터 및 신뢰도 점수 포함
공통 응답 필드
표준 출력에는 일반적으로 다음이 포함됩니다.
-
extractedData
: 추출된 주요 정보 -
confidence
: 추출된 각 필드의 신뢰도 점수 -
metadata
: 타임스탬프 및 모델 세부 정보를 포함한 정보 처리 -
boundingBoxes
: 감지된 요소의 위치 정보(활성화된 경우)
오류 처리 및 문제 해결
일반적인 오류 시나리오 및 해결 방법:
-
잘못된 S3 URI: S3 버킷이 존재하고 적절한 권한이 있는지 확인합니다.
-
data-automation-profile-arn 누락:이 파라미터는 모든 처리 요청에 필요합니다.
-
프로젝트를 찾을 수 없음: 프로젝트 ARN이 올바르고 프로젝트가 존재하는지 확인합니다.
-
지원되지 않는 파일 형식: 파일 형식이 BDA에서 지원되는지 확인
처리 작업에 태그 추가
태그를 추가하여 처리 작업을 구성하고 추적할 수 있습니다.
aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"