3단계: Amazon S3의 문서에 대한 분석 작업 실행 - Amazon Comprehend

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

3단계: Amazon S3의 문서에 대한 분석 작업 실행

데이터를 Amazon S3에 저장한 후 Amazon Comprehend 분석 작업을 실행할 수 있습니다. 감성 분석 작업은 문서의 전반적인 분위기(긍정적, 부정적, 중립적 또는 혼합)를 결정합니다. 개체 분석 작업은 문서에서 실제 객체의 이름을 추출합니다. 이러한 객체에는 사람, 장소, 제목, 이벤트, 날짜, 수량, 제품 및 조직이 포함됩니다. 이 단계에서는 2개의 Amazon Comprehend 분석 작업을 실행하여 샘플 데이터 세트에서 감성 및 개체를 추출합니다.

필수 조건

시작하기 전에 다음을 수행하십시오.

감성과 개체를 분석합니다.

첫 번째로 실행하는 작업은 샘플 데이터 세트에 있는 각 고객 리뷰의 감성을 분석합니다. 두 번째 작업은 각 고객 리뷰의 개체를 추출합니다. Amazon Comprehend 분석 작업은 Amazon Comprehend 콘솔 또는 AWS CLI를 사용하여 수행할 수 있습니다.

작은 정보

Amazon Comprehend를 지원하는 AWS 지역에 있는지 확인하십시오. 자세한 내용은 글로벌 인프라 가이드리전 테이블을 참조하세요.

Amazon Comprehend 콘솔 사용 시, 한 번에 하나의 작업을 생성합니다. 감성과 개체 분석 작업을 모두 실행하려면 다음 단계를 반복해야 합니다. 첫 번째 작업을 위해서는 IAM 역할을 생성하지만 두 번째 작업에서는 첫 번째 작업의 IAM 역할을 재사용할 수 있습니다. 동일한 S3 버킷과 폴더를 사용하는 한 IAM 역할을 재사용할 수 있습니다.

감성 및 개체 분석 작업을 실행하려면(콘솔)
  1. Amazon Simple Storage Service(S3) 버킷을 생성한 리전과 동일한 리전에 있는지 확인합니다. 다른 지역에 있는 경우 탐색 표시줄의 AWS 지역 선택기에서 S3 버킷을 생성한 지역을 선택합니다.

  2. https://console.aws.amazon.com/comprehend/에서 Amazon Comprehend 콘솔을 엽니다.

  3. Amazon Comprehend 시작을 선택합니다.

  4. 탐색 창에서 분석 작업을 선택합니다.

  5. 작업 생성을 선택합니다.

  6. 작업 설정 섹션에서 다음을 수행합니다.

    1. 이름reviews-sentiment-analysis를 입력합니다.

    2. 분석 유형에서 감성을 선택합니다.

    3. 언어에서 영어를 선택합니다.

    4. 작업 암호화 설정은 비활성 상태를 유지합니다.

  7. 입력 데이터 섹션에서 다음을 수행합니다.

    1. 데이터 소스내 문서를 선택합니다.

    2. S3 위치S3 찾아보기를 선택한 다음 버킷 목록에서 버킷을 선택합니다.

    3. S3 버킷에서 객체input 폴더를 선택합니다.

    4. input 폴더에서 샘플 데이터세트 amazon-reviews.csv를 선택한 다음 선택하기를 선택합니다.

    5. 입력 형식으로 라인 하나에 문서 하나 선택합니다.

  8. 출력 데이터 섹션에서 다음을 수행합니다.

    1. S3 위치S3 찾아보기를 선택한 다음 버킷 목록에서 버킷을 선택합니다.

    2. S3 버킷에서 객체output 폴더를 선택한 다음 선택하기를 선택합니다.

    3. 암호화는 꺼진 상태로 둡니다.

  9. 권한 연결 섹션에서 다음을 수행합니다.

    1. IAM 역할에서 IAM 역할 생성을 선택합니다.

    2. 액세스 권한입력 및 출력 S3 버킷을 선택합니다.

    3. 이름 접미사comprehend-access-role을 입력합니다. 이 역할은 Amazon S3 버킷에 대한 액세스를 제공합니다.

  10. 작업 생성을 선택합니다.

  11. 1~10단계를 반복하여 개체 분석 작업을 생성합니다. 다음과 같이 변경합니다.

    1. 작업 설정에서 이름reviews-entities-analysis를 입력합니다.

    2. 작업 설정에서 분석 유형으로 개체를 선택합니다.

    3. 액세스 권한에서 기존 IAM 역할 사용을 선택합니다. 역할 이름으로 AmazonComprehendServiceRole-comprehend-access-role을 선택합니다(감성 작업에 대해 생성한 역할과 동일).

start-sentiment-detection-jobstart-entities-detection-job 명령을 사용하여 감성 및 개체 분석 작업을 실행합니다. 각 명령을 실행하면 출력 S3 위치를 포함하여 작업에 대한 세부 정보에 액세스할 수 있는 JobId 값이 포함된 JSON 객체가 AWS CLI 표시됩니다.

감정 및 개체 분석 작업 (AWS CLI) 을 실행하려면
  1. AWS CLI에서 다음 명령을 실행하여 감성 분석 작업을 시작합니다. arn:aws:iam::123456789012:role/comprehend-access-role을 이전에 텍스트 편집기에 복사한 IAM 역할 ARN으로 바꿉니다. 기본 AWS CLI 지역이 Amazon S3 버킷을 생성한 지역과 다른 경우, --region 파라미터를 포함하고 버킷이 있는 지역으로 us-east-1 바꾸십시오.

    aws comprehend start-sentiment-detection-job --input-data-config S3Uri=s3://DOC-EXAMPLE-BUCKET/input/ --output-data-config S3Uri=s3://DOC-EXAMPLE-BUCKET/output/ --data-access-role-arn arn:aws:iam::123456789012:role/comprehend-access-role --job-name reviews-sentiment-analysis --language-code en [--region us-east-1]
  2. 작업을 제출한 후 JobId를 복사하여 텍스트 편집기에 저장합니다. 분석 작업에서 출력 파일을 찾으려면 JobId가 필요합니다.

  3. 다음 명령을 실행하여 개체 분석 작업을 시작합니다.

    aws comprehend start-entities-detection-job --input-data-config S3Uri=s3://DOC-EXAMPLE-BUCKET/input/ --output-data-config S3Uri=s3://DOC-EXAMPLE-BUCKET/output/ --data-access-role-arn arn:aws:iam::123456789012:role/comprehend-access-role --job-name reviews-entities-analysis --language-code en [--region us-east-1]
  4. 작업을 제출한 후 JobId를 복사하여 텍스트 편집기에 저장합니다.

  5. 작업의 상태를 확인합니다. JobId를 추적하여 작업 진행률을 볼 수 있습니다.

    감성 분석 작업 진행률을 추적하려면 다음 명령을 실행합니다. sentiment-job-id를 감성 분석을 실행한 후 복사한 JobId로 바꿉니다.

    aws comprehend describe-sentiment-detection-job --job-id sentiment-job-id

    개체 분석 작업을 추적하려면 다음 명령을 실행합니다. entities-job-id를 개체 분석을 실행한 후 복사한 JobId로 바꿉니다.

    aws comprehend describe-entities-detection-job --job-id entities-job-id

    JobStatusCOMPLETED으로 표시되는 데 몇 분 정도 걸립니다.

감성 및 개체 분석 작업을 완료했습니다. 다음 단계로 이동하기 전에 두 작업을 모두 완료해야 합니다. 작업을 완료하는 데 몇 분 정도 걸릴 수 있습니다.