CLI를 통한 처리 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

CLI를 통한 처리

CLI를 통해 첫 번째 문서 처리

S3 버킷에 파일 입력

BDA로 문서를 처리하기 전에 먼저 S3 버킷에 문서를 업로드해야 합니다.

구문

aws s3 cp <source> <target> [--options]

예시

aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf

기본 처리 명령 구조

invoke-data-automation-async 명령을 사용하여 파일을 처리합니다.

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg" }' \ --output-configuration '{ "s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

고급 처리 명령 구조

시간 세그먼트를 사용한 비디오 처리

비디오 파일의 경우 처리할 시간 세그먼트를 지정할 수 있습니다.

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/video.mp4", "assetProcessingConfiguration": { "video": { "segmentConfiguration": { "timestampSegment": { "startTimeMillis": 0, "endTimeMillis": 300000 } } } } }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

사용자 지정 블루프린트 사용

명령에서 직접 사용자 지정 블루프린트를 지정할 수 있습니다.

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --blueprints '[ { "blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

암호화 구성 추가

보안 강화를 위해 암호화 구성을 추가할 수 있습니다.

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --encryption-configuration '{ "kmsKeyId": "Amazon Resource Name (ARN)", "kmsEncryptionContext": { "Department": "Finance", "Project": "DocumentProcessing" } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

이벤트 알림

처리 완료를 위해 EventBridge 알림 활성화:

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --notification-configuration '{ "eventBridgeConfiguration": { "eventBridgeEnabled": true } }' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"

처리 상태 확인

get-data-automation-status 명령을 사용하여 처리 작업의 상태를 확인합니다.

aws bedrock-data-automation-runtime get-data-automation-status \ --invocation-arn "Amazon Resource Name (ARN)"

응답에는 현재 상태가 포함됩니다.

{ "status": "COMPLETED", "creationTime": "2025-07-24T12:34:56.789Z", "lastModifiedTime": "2025-07-24T12:45:12.345Z", "outputLocation": "s3://my-bucket/output/abcd1234/" }

처리 결과 검색

S3에서 출력 파일 찾기

S3 버킷의 출력 파일을 나열합니다.

aws s3 ls s3://amzn-s3-demo-bucket/output/

결과를 로컬 시스템에 다운로드합니다.

aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive

출력 구조 이해

출력에는 일반적으로 다음이 포함됩니다.

  • standard-output.json: 표준 추출 결과 포함

  • custom-output.json: 사용자 지정 블루프린트의 결과를 포함합니다.

  • metadata.json: 처리 메타데이터 및 신뢰도 점수 포함

공통 응답 필드

표준 출력에는 일반적으로 다음이 포함됩니다.

  • extractedData: 추출된 주요 정보

  • confidence: 추출된 각 필드의 신뢰도 점수

  • metadata: 타임스탬프 및 모델 세부 정보를 포함한 정보 처리

  • boundingBoxes: 감지된 요소의 위치 정보(활성화된 경우)

오류 처리 및 문제 해결

일반적인 오류 시나리오 및 해결 방법:

  • 잘못된 S3 URI: S3 버킷이 존재하고 적절한 권한이 있는지 확인합니다.

  • data-automation-profile-arn 누락:이 파라미터는 모든 처리 요청에 필요합니다.

  • 프로젝트를 찾을 수 없음: 프로젝트 ARN이 올바르고 프로젝트가 존재하는지 확인합니다.

  • 지원되지 않는 파일 형식: 파일 형식이 BDA에서 지원되는지 확인

처리 작업에 태그 추가

태그를 추가하여 처리 작업을 구성하고 추적할 수 있습니다.

aws bedrock-data-automation-runtime invoke-data-automation-async \ --input-configuration '{ "s3Uri": "s3://my-bucket/document.pdf" }' \ --output-configuration '{ "s3Uri": "s3://my-bucket/output/" }' \ --data-automation-configuration '{ "dataAutomationProjectArn": "Amazon Resource Name (ARN)", "stage": "LIVE" }' \ --tags '[ { "key": "Department", "value": "Finance" }, { "key": "Project", "value": "InvoiceProcessing" } ]' \ --data-automation-profile-arn "Amazon Resource Name (ARN)"