기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
다음 자습서에서는 Amazon A2I 콘솔에서 Amazon A2I를 시작하는 방법을 보여줍니다.
이 자습서에서는 Amazon Textract와 함께 Augmented AI를 사용하여 문서를 검토하거나 Amazon Rekognition을 사용하여 이미지 콘텐츠를 검토하는 옵션을 제공합니다.
사전 조건
Amazon A2I 사용을 시작하려면 다음 사전 조건을 완료하세요.
-
입력 및 출력 데이터의 워크플로와 동일한 AWS 리전에 Amazon S3 버킷을 생성합니다. 예를 들어 us-east-1에 Amazon Textract와 함께 Amazon A2I를 사용하는 경우 us-east-1에 버킷을 생성합니다. 버킷을 생성하려면 Amazon Simple Storage Service 콘솔 사용 설명서에서 버킷 생성의 지침을 따르세요.
-
다음 중 하나를 수행합니다.
-
Amazon Textract를 사용하여 자습서를 완료하려면 이 이미지를 다운로드하여 Amazon S3 버킷에 저장하세요.
-
Amazon Rekognition을 사용하여 자습서를 완료하려면 이 이미지를 다운로드하여 Amazon S3 버킷에 저장하세요.
-
참고
Amazon A2I 콘솔은 SageMaker AI 콘솔에 포함되어 있습니다.
1단계: 작업 팀 생성
먼저 Amazon A2I 콘솔에서 작업 팀을 만들고 자신을 작업자로 추가하여 작업자 검토 태스크를 미리 볼 수 있도록 합니다.
중요
이 자습서에서는 프라이빗 작업 팀을 사용합니다. Amazon A2I 프라이빗 작업 인력은 SageMaker AI 콘솔의 Ground Truth 영역에 구성되며 Amazon A2I와 Ground Truth 간에 공유됩니다.
작업자 이메일을 사용하여 프라이빗 작업 인력을 생성하려면
-
https://console.aws.amazon.com/sagemaker/
SageMaker AI 콘솔을 엽니다. -
탐색 창에서 Ground Truth에 있는 레이블 지정 인력을 선택합니다.
-
프라이빗을 선택한 다음 Create private team(프라이빗 팀 생성)을 선택합니다.
-
Invite new workers by email(이메일로 새 작업자 초대)을 선택합니다.
-
이 자습서에서는 인적 태스크 UI를 미리 볼 수 있도록 이메일을 비롯한 기타 내용을 입력하세요. 최대 50개의 이메일 주소(쉼표로 구분)의 목록을 이메일 주소 상자에 붙여 넣거나 입력할 수 있습니다.
-
조직 이름과 연락처 이메일을 입력합니다.
-
선택에 따라 팀에서 구독할 Amazon SNS 주제를 선택하여 새 Ground Truth 레이블 지정 작업을 사용할 수 있을 때 작업자에게 이메일로 알립니다. Amazon SNS 알림은 Ground Truth에서 지원되지만 Augmented AI에서는 지원되지 않습니다. 작업자가 Amazon SNS 알림을 구독하는 경우 작업자는 Ground Truth 레이블 지정 작업에 대한 알림만 받습니다. Augmented AI 작업에 대한 알림은 받지 않습니다.
-
Create private team(프라이빗 팀 생성)을 선택합니다.
프라이빗 작업 팀에 자신을 추가하면 no-reply@verificationemail.com
으로부터 로그인 정보가 포함된 이메일을 받게 됩니다. 이 이메일에 있는 링크를 사용하여 암호를 재설정하고 작업자 포털에 로그인합니다. 인적 루프를 만들 때 인적 검토 작업이 표시되는 곳입니다.
2단계: 인적 검토 워크플로 생성
이 단계에서는 인적 검토 워크플로를 생성합니다. 각 인적 검토 워크플로는 특정 태스크 유형에 맞게 생성됩니다. 이 자습서에서는 기본 제공 태스크 유형인 Amazon Rekognition과 Amazon Textract를 선택할 수 있습니다.
인적 검토 워크플로를 생성하는 방법
-
https://console.aws.amazon.com/a2i
에서 Augmented AI 콘솔을 열어 인적 검토 워크플로 페이지에 액세스합니다. -
인적 검토 워크플로 생성을 선택합니다.
-
워크플로 설정에서 AWS 관리형 정책이
AmazonAugmentedAIIntegratedAPIAccess
연결된 상태로 워크플로 이름, S3 버킷 및이 자습서를 위해 생성한 IAM 역할을 입력합니다. -
태스크 유형에서 Textract - 키-값 쌍 추출 또는 Rekognition- 이미지 조절을 선택합니다.
-
다음 표에서 선택한 태스크 유형을 선택하여 해당 태스크 유형에 대한 지침을 확인합니다.
1. 양식 키 신뢰도 점수를 기반으로 또는 특정 양식 키가 누락되었을 때 특정 양식 키에 대한 인적 검토 트리거를 선택합니다.
2. 키 이름에
Mail Address
를 입력합니다.3. 식별 신뢰도 임곗값을
0
~99
로 설정합니다.4. 검증 신뢰도 임곗값을
0
~99
로 설정합니다.5. Amazon Textract에서 신뢰도 점수가 지정된 범위에 속하는 것으로 식별된 모든 양식 키에 대한 인적 검토 트리거를 선택합니다.
6. 식별 신뢰도 임곗값을
0
~90
로 설정합니다.7. 검증 신뢰도 임곗값을
0
~90
로 설정합니다.그러면 Amazon Textract가
Mail Address
및 키에 대해99
미만의 신뢰도 점수를 반환하거나 문서에서 탐지된 키 값 쌍에 대해90
미만의 신뢰도 점수를 반환하는 경우 인적 검토가 트리거됩니다.다음 이미지는 Amazon A2I 콘솔의 Amazon Textract 양식 추출 - 인적 검토를 호출하기 위한 조건 섹션을 보여줍니다. 이미지에서는 앞 단락에 설명된 두 가지 유형의 트리거 확인란이 선택되어 있으며 첫 번째 트리거의 키 이름으로
Mail Address
가 사용됩니다. 식별 신뢰도 임곗값은 양식 내에서 탐지된 키-값 쌍에 대한 신뢰도 점수를 사용하여 정의되며 0에서 99 사이로 설정됩니다. 검증 신뢰도 임곗값은 양식 내의 키 및 값에 포함된 텍스트에 대한 신뢰도 점수를 사용하여 정의되며 0에서 99 사이로 설정됩니다. -
작업자 태스크 템플릿 생성에서 기본 템플릿에서 생성을 선택합니다.
-
템플릿 이름을 입력합니다.
-
작업 설명 필드에 다음 텍스트를 입력합니다.
Read the instructions carefully and complete the task.
-
작업자에서 프라이빗을 선택합니다.
-
생성한 프라이빗 팀을 선택합니다.
-
생성(Create)을 선택합니다.
인적 검토 워크플로가 생성되면 인적 검토 워크플로 페이지의 테이블에 표시됩니다. 상태가 Active
이면 워크플로 ARN을 복사하여 저장합니다. 이 정보는 다음 단계에 필요합니다.
3단계: 인적 루프 시작
인적 루프를 시작하려면 API 작업을 사용해야 합니다. 이러한 API 작업과 상호 작용하는 데 사용할 수 있는 다양한 언어별 SDK가 있습니다. 각 SDK에 대한 설명서를 보려면 다음 이미지에 표시된 대로 API 설명서의 참고 항목 섹션을 참조하세요.

이 자습서에서는 다음 API 중 하나를 사용합니다.
-
Amazon Textract 태스크 유형을 선택한 경우
AnalyzeDocument
작업을 사용합니다. -
Amazon Rekognition 태스크 유형을 선택한 경우
DetectModerationLabels
작업을 사용합니다.
SageMaker 노트북 인스턴스(신규 사용자에게 권장됨) 또는 AWS Command Line Interface ()를 사용하여 이러한 APIs와 상호 작용할 수 있습니다AWS CLI. 다음 중 하나를 선택하여 옵션에 대해 자세히 알아보세요.
-
노트북 인스턴스에 대해 자세히 알아보고 설정하려면 Amazon SageMaker 노트북 인스턴스 섹션을 참조하세요.
-
에 대해 자세히 알아보고 사용을 시작하려면 AWS Command Line Interface 사용 설명서의 AWS 명령줄 인터페이스란 무엇입니까?를 AWS CLI참조하세요.
다음 테이블에서 태스크 유형을 선택하면 AWS SDK for Python (Boto3)을 사용하는 Amazon Textract와 Amazon Rekognition에 대한 요청 예시를 볼 수 있습니다.
다음 예제에서는를 사용하여 us-west-2analyze_document
에서 AWS SDK for Python (Boto3) 를 호출합니다. 기울임꼴로 표시된 빨간색 텍스트를 귀사의 리소스로 바꾸세요. Amazon Mechanical Turk 인력을 사용하는 경우 DataAttributes
파라미터를 포함하세요. 추가 정보는AWS SDK for Python (Boto) API 참조의 analyze_document
설명서를 참조하세요.
response = client.analyze_document(
Document={
"S3Object": {
"Bucket": "amzn-s3-demo-bucket
",
"Name": "document-name.pdf
"
}
},
HumanLoopConfig={
"FlowDefinitionArn":"arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name
",
"HumanLoopName":"human-loop-name
",
"DataAttributes" : {
"ContentClassifiers":["FreeOfPersonallyIdentifiableInformation"
,"FreeOfAdultContent"
]
}
},
FeatureTypes=["TABLES", "FORMS"])
4단계: 콘솔에서 인적 루프 상태 보기
인적 루프를 시작하면 Amazon A2I 콘솔에서 상태를 볼 수 있습니다.
인적 루프 상태를 보는 방법
-
https://console.aws.amazon.com/a2i
에서 Augmented AI 콘솔을 열어 인적 검토 워크플로 페이지에 액세스합니다. -
인적 루프를 시작하는 데 사용한 인적 검토 워크플로를 선택합니다.
-
인적 루프 섹션에서 인적 루프를 볼 수 있습니다. 상태 열에서 상태를 확인합니다.
5단계: 출력 데이터 다운로드
출력 데이터는 인적 검토 워크플로를 생성할 때 지정한 Amazon S3 버킷에 저장됩니다.
Amazon A2I 출력 데이터를 보는 방법
-
Amazon S3 콘솔
을 엽니다. -
이 예제의 2단계에서 인적 검토 워크플로를 생성할 때 지정한 Amazon S3 버킷을 선택합니다.
-
인적 검토 워크플로에 따라 이름이 지정된 폴더부터 시작하여 다음 명명 규칙에 따라 폴더를 선택하여 출력 데이터로 이동합니다.
s3://
output-bucket-specified-in-human-review-workflow
/human-review-workflow-name
/YYYY
/MM
/DD
/hh
/mm
/ss
/human-loop-name
/output.json -
output.json
을 선택하고 다운로드를 선택합니다.