분류기 학습 데이터 준비 - Amazon Comprehend

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

분류기 학습 데이터 준비

사용자 지정 분류의 경우 멀티클래스 모드 또는 멀티레이블 모드에서 모델을 학습합니다. 멀티클래스 모드는 단일 클래스를 각 문서와 연결합니다. 멀티레이블 모드는 하나 이상의 클래스를 각 문서와 연결합니다. 입력 파일 형식은 모드마다 다르므로 학습 데이터를 생성하기 전에 사용할 모드를 선택합니다.

참고

Amazon Comprehend 콘솔에서는 멀티클래스 모드를 단일 레이블 모드라고 합니다.

사용자 지정 분류는 일반 텍스트 문서로 학습하는 모델 및 기본 문서 (예: Word 또는 이미지) 로 학습하는 모델을 지원합니다. PDF 분류기 모델 및 지원되는 문서 유형에 대한 자세한 내용은 학습 분류 모델을 참조하세요.

사용자 지정 분류기 모델을 학습할 데이터를 준비하려면:

  1. 이 분류기가 분석할 클래스를 식별합니다. 사용할 모드(멀티클래스 또는 멀티레이블)를 결정합니다.

  2. 모델이 일반 텍스트 문서 또는 반정형 문서를 분석하기 위한 모델인지에 따라 분류기 모델 유형을 결정합니다.

  3. 각 클래스에 대한 문서 예제를 수집합니다. 최소 학습 요구 사항은 문서 분류를 위한 일반 할당량을 참조하세요.

  4. 일반 텍스트 모델의 경우 사용할 교육 파일 형식 (파일 또는 증강 매니페스트 CSV 파일) 을 선택합니다. 네이티브 문서 모델을 학습시키려면 항상 파일을 사용해야 합니다. CSV