

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# CLI를 통한 처리
<a name="bda-document-processing-cli"></a>

BDA로 문서를 처리하기 전에 먼저 S3 버킷에 문서를 업로드해야 합니다.

**구문**

```
aws s3 cp <source> <target> [--options]
```

예제:

```
aws s3 cp /local/path/document.pdf s3://my-bda-bucket/input/document.pdf
```

------
#### [ Async ]

**기본 처리 명령 구조**

`invoke-data-automation-async` 명령을 사용하여 파일을 처리합니다.

```
aws bedrock-data-automation-runtime invoke-data-automation-async \
        --input-configuration '{
            "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg"
        }' \
        --output-configuration '{
            "s3Uri": "s3://amzn-s3-demo-bucket/output/"
        }' \
        --data-automation-configuration '{
            "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
            "stage": "LIVE"
        }' \
        --data-automation-profile-arn "Amazon Resource Name (ARN)"
```

**고급 처리 명령 구조**

**시간 세그먼트를 사용한 비디오 처리**

비디오 파일의 경우 처리할 시간 세그먼트를 지정할 수 있습니다.

```
aws bedrock-data-automation-runtime invoke-data-automation-async \
        --input-configuration '{
            "s3Uri": "s3://my-bucket/video.mp4",
            "assetProcessingConfiguration": {
                "video": {
                    "segmentConfiguration": {
                        "timestampSegment": {
                            "startTimeMillis": 0,
                            "endTimeMillis": 300000
                        }
                    }
                }
            }
        }' \
        --output-configuration '{
            "s3Uri": "s3://my-bucket/output/"
        }' \
        --data-automation-configuration '{
            "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
            "stage": "LIVE"
        }' \
        --data-automation-profile-arn "Amazon Resource Name (ARN)"
```

**사용자 지정 블루프린트 사용**

명령에서 직접 사용자 지정 블루프린트를 지정할 수 있습니다.

```
aws bedrock-data-automation-runtime invoke-data-automation-async \
        --input-configuration '{
            "s3Uri": "s3://my-bucket/document.pdf"
        }' \
        --output-configuration '{
            "s3Uri": "s3://my-bucket/output/"
        }' \
        --blueprints '[
            {
                "blueprintArn": "Amazon Resource Name (ARN)",
                "version": "1",
                "stage": "LIVE"
            }
        ]' \
        --data-automation-profile-arn "Amazon Resource Name (ARN)"
```

**암호화 구성 추가**

보안 강화를 위해 암호화 구성을 추가할 수 있습니다.

```
aws bedrock-data-automation-runtime invoke-data-automation-async \
        --input-configuration '{
            "s3Uri": "s3://my-bucket/document.pdf"
        }' \
        --output-configuration '{
            "s3Uri": "s3://my-bucket/output/"
        }' \
        --data-automation-configuration '{
            "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
            "stage": "LIVE"
        }' \
        --encryption-configuration '{
            "kmsKeyId": "Amazon Resource Name (ARN)",
            "kmsEncryptionContext": {
                "Department": "Finance",
                "Project": "DocumentProcessing"
            }
        }' \
        --data-automation-profile-arn "Amazon Resource Name (ARN)"
```

**이벤트 알림**

처리 완료를 위해 EventBridge 알림 활성화:

```
aws bedrock-data-automation-runtime invoke-data-automation-async \
        --input-configuration '{
            "s3Uri": "s3://my-bucket/document.pdf"
        }' \
        --output-configuration '{
            "s3Uri": "s3://my-bucket/output/"
        }' \
        --data-automation-configuration '{
            "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
            "stage": "LIVE"
        }' \
        --notification-configuration '{
            "eventBridgeConfiguration": {
                "eventBridgeEnabled": true
            }
        }' \
        --data-automation-profile-arn "Amazon Resource Name (ARN)"
```

**처리 상태 확인**

처리 작업의 상태를 확인하려면 `get-data-automation-status` 명령을 사용합니다.

```
aws bedrock-data-automation-runtime get-data-automation-status \
        --invocation-arn "Amazon Resource Name (ARN)"
```

응답에는 현재 상태가 포함됩니다.

```
{
        "status": "COMPLETED",
        "creationTime": "2025-07-24T12:34:56.789Z",
        "lastModifiedTime": "2025-07-24T12:45:12.345Z",
        "outputLocation": "s3://my-bucket/output/abcd1234/"
        }
```

**처리 결과 검색**

**S3에서 출력 파일 찾기**

S3 버킷의 출력 파일 나열:

```
aws s3 ls s3://amzn-s3-demo-bucket/output/
```

결과를 로컬 시스템에 다운로드하려면 다음을 수행합니다.

```
aws s3 cp s3://amzn-s3-demo-bucket/output/ ~/Downloads/bda-results/ --recursive
```

**출력 구조 이해**

출력에는 일반적으로 다음이 포함됩니다.
+ `standard-output.json`: 표준 추출 결과 포함
+ `custom-output.json`: 사용자 지정 블루프린트의 결과 포함
+ `metadata.json`: 처리 메타데이터 및 신뢰도 점수 포함

**공통 응답 필드**

표준 출력에는 일반적으로 다음이 포함됩니다.
+ `extractedData`: 추출된 주요 정보
+ `confidence`: 추출된 각 필드의 신뢰도 점수
+ `metadata`: 타임스탬프 및 모델 세부 정보를 포함한 처리 정보
+ `boundingBoxes`: 감지된 요소의 위치 정보(활성화된 경우)

**오류 처리 및 문제 해결**

일반적인 오류 시나리오 및 해결 방법:
+ **잘못된 S3 URI**: S3 버킷이 존재하고 적절한 권한이 있는지 확인합니다.
+ **data-automation-profile-arn 누락**:이 파라미터는 모든 처리 요청에 필요합니다.
+ **프로젝트를 찾을 수 없음**: 프로젝트 ARN이 올바르고 프로젝트가 존재하는지 확인합니다.
+ **지원되지 않는 파일 형식**: 파일 형식이 BDA에서 지원되는지 확인합니다.

**처리 작업에 태그 추가**

태그를 추가하여 처리 작업을 구성하고 추적할 수 있습니다.

```
aws bedrock-data-automation-runtime invoke-data-automation-async \
        --input-configuration '{
            "s3Uri": "s3://my-bucket/document.pdf"
        }' \
        --output-configuration '{
            "s3Uri": "s3://my-bucket/output/"
        }' \
        --data-automation-configuration '{
            "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
            "stage": "LIVE"
        }' \
        --tags '[
            {
                "key": "Department",
                "value": "Finance"
            },
            {
                "key": "Project",
                "value": "InvoiceProcessing"
            }
        ]' \
        --data-automation-profile-arn "Amazon Resource Name (ARN)"
```

------
#### [ Sync ]

**기본 처리 명령 구조**

`invoke-data-automation` 명령을 사용하여 파일을 처리합니다.

```
        aws bedrock-data-automation-runtime invoke-data-automation \
        --input-configuration '{
            "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg"
        }' \
        --data-automation-configuration '{
            "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
            "stage": "LIVE"
        }' \
        --data-automation-profile-arn "Amazon Resource Name (ARN)"
        --region "aws-region"
```

**고급 처리 명령 구조**

S3 버킷으로 출력

```
        aws bedrock-data-automation-runtime invoke-data-automation \
        --input-configuration '{
            "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg"
        }' \
        --output-configuration '{"s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \
        --data-automation-configuration '{
            "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
            "stage": "LIVE"
        }' \
        --data-automation-profile-arn "Amazon Resource Name (ARN)"
        --region "aws-region"   //document only
```

바이트 입력 사용

```
        aws bedrock-data-automation-runtime invoke-data-automation \
        --input-configuration '{
            "bytes": #blob input
        }' \
        --output-configuration '{"s3Uri": "s3://amzn-s3-demo-bucket/output/" }' \
        --data-automation-configuration '{
            "dataAutomationProjectArn": "Amazon Resource Name (ARN)",
            "stage": "LIVE"
        }' \
        --data-automation-profile-arn "Amazon Resource Name (ARN)"
        --region "aws-region"
```

**참고**  
**바이트**  
base64로 인코딩된 문서 바이트의 BLOB입니다. 바이트 BLOB에 제공되는 문서의 최대 크기는 50MB입니다. 유형은 Base64-encoded 바이너리 데이터 객체여야 합니다.

**사용자 지정 블루프린트 사용(이미지에만 해당)**

```
        aws bedrock-data-automation-runtime invoke-data-automation \
        --input-configuration '{
            "s3Uri": "s3://amzn-s3-demo-bucket/sample-images/sample-image.jpg"
        }' \
        --blueprints '[{"blueprintArn": "Amazon Resource Name (ARN)", "version": "1", "stage": "LIVE" } ]' \
        --data-automation-profile-arn "Amazon Resource Name (ARN)"
        --region "aws-region"
```

------