Amazon SageMaker Ground Truth 작업 사용하기 - Amazon Lookout for Vision

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon SageMaker Ground Truth 작업 사용하기

이미지에 레이블을 지정하는 데는 상당한 시간이 걸릴 수 있습니다. 예를 들어, 예외 항목 주위에 마스크를 정확하게 그리는 데 10초가 걸릴 수 있습니다. 이미지가 100개라면 레이블을 지정하는 데 몇 시간이 걸릴 수 있습니다. 이미지에 직접 레이블을 지정하는 대신 Amazon SageMaker Ground Truth를 사용하는 것을 고려해 보십시오.

Amazon SageMaker Ground Truth를 사용하면 선택한 공급업체 회사인 Amazon Mechanical Turk의 작업자 또는 사내 민간 인력을 사용하여 레이블이 지정된 이미지 세트를 만들 수 있습니다. 자세한 내용은 Amazon SageMaker Ground Truth를 사용한 데이터 레이블 지정을 참조하십시오.

Amazon Mechanical Turk를 사용하는 데는 비용이 부과됩니다. 또한 Amazon Ground Truth 라벨 제작 작업을 완료하는 데 며칠이 걸릴 수 있습니다. 비용이 문제가 되거나 모델을 빠르게 학습시켜야 하는 경우 Amazon Lookout for Vision 콘솔을 사용하여 이미지에 레이블을 지정하는 것이 좋습니다.

Amazon SageMaker Ground Truth 레이블 지정 작업을 사용하여 이미지 분류 모델 및 이미지 분할 모델에 적합한 이미지에 레이블을 지정할 수 있습니다. 작업이 완료되면 출력 매니페스트 파일을 사용하여 Amazon Lookout for Vision 데이터세트를 생성합니다.

이미지 분류

이미지 분류 모델용 이미지에 라벨을 지정하려면 이미지 분류 (단일 레이블) 작업에 대한 라벨링 작업을 생성하십시오.

이미지 세분화

이미지 세분화 모델용 이미지에 레이블을 지정하려면 이미지 분류 (단일 레이블) 작업을 위한 레이블 지정 작업을 생성하십시오. 그런 다음 작업을 연계하여 이미지 의미 체계 세분화 작업을 위한 레이블 지정 작업을 생성하십시오.

레이블 지정 작업을 사용하여 이미지 세분화 모델의 부분 매니페스트 파일을 만들 수도 있습니다. 예를 들어, 이미지 분류 (단일 레이블) 작업으로 이미지를 세분화할 수 있습니다. 작업 출력으로 Lookout for Vision 데이터세트를 생성한 후 Amazon Lookout for Vision 콘솔을 사용하여 데이터세트 이미지에 세분화 마스크와 예외 항목 레이블을 추가합니다.

Amazon SageMaker Ground Truth를 사용하여 이미지에 레이블 지정

다음 절차는 Amazon SageMaker Ground Truth 이미지 레이블 지정 작업을 사용하여 이미지에 레이블을 지정하는 방법을 보여줍니다. 이 절차는 이미지 세분화 매니페스스트 파일을 생성하고 선택적으로 이미지 레이블 지정 작업을 연결하여 이미지 분할 매니페스트 파일을 생성합니다. 프로젝트에 별도의 테스트 데이터 세트를 만들려면 이 절차를 반복하여 테스트 데이터 세트용 매니페스트 파일을 만드세요.

Amazon SageMaker Ground Truth를 사용하여 이미지에 레이블을 지정하려면 (콘솔)
  1. 라벨링 작업 생성 (콘솔)의 지침에 따라 이미지 분류 (단일 레이블) 작업을 위한 Ground Truth 작업을 생성하십시오.

    1. 10단계에서는 작업 범주 드롭다운 메뉴에서 이미지를 선택하고 작업 유형으로 이미지 분류 (단일 레이블)를 선택합니다.

    2. 16단계의 경우 이미지 분류 (단일 레이블) 레이블 지정 도구 섹션에서 정상이상 레이블이라는 두 개의 레이블을 추가합니다.

  2. 직원이 이미지 분류를 완료할 때까지 기다리십시오.

  3. 이미지 세분화 모델용 데이터세트를 만드는 경우 다음을 수행하세요. 4단계로 이동합니다.

    1. Amazon SageMaker Ground Truth 콘솔에서 라벨 제작 작업 페이지를 엽니다.

    2. 이전에 생성한 작업을 선택합니다. 그러면 작업 메뉴가 활성화됩니다.

    3. 작업 메뉴에서 Chain(연결)을 선택합니다. 작업 상세 페이지가 열립니다.

    4. 작업 유형에서 의미 체계 세분화를 선택합니다.

    5. 다음을 선택합니다.

    6. 의미 체계 세분화 라벨링 도구 섹션에서 모델에서 찾고자 하는 각 예외 유형에 대해 예외 항목 레이블을 추가합니다.

    7. 생성을 선택합니다.

    8. 직원이 이미지에 라벨을 붙일 때까지 기다리세요.

  4. Ground Truth 콘솔을 열고 라벨링 작업 페이지를 엽니다.

  5. 이미지 분류 모델을 생성하는 경우 1단계에서 생성한 작업을 선택합니다. 이미지 세분화 모델을 만드는 경우 3단계에서 만든 작업을 선택하십시오.

  6. 라벨링 작업 요약의 출력 데이터 세트 위치에서 S3 위치를 엽니다. 매니페스트 파일 위치를 기록해 둡니다. s3://output-dataset-location/manifests/output/output.manifest위치가 맞아야 합니다.

  7. 테스트 데이터 세트에 대한 매니페스트 파일을 만들려면 이 절차를 반복하세요. 그렇지 않으면 데이터 세트 생성의 지침에 따라 매니페스트 파일로 데이터 세트를 만드세요.

데이터 세트 생성

이 절차를 사용하여 Amazon SageMaker Ground Truth를 사용하여 이미지에 레이블 지정의 6단계에서 기록해 둔 매니페스트 파일을 사용하여 Lookout for Vision 프로젝트에서 데이터세트를 만들 수 있습니다. 매니페스트 파일은 단일 데이터 세트 프로젝트에 대한 교육 데이터 세트를 만듭니다. 프로젝트에 별도의 테스트 데이터세트를 포함하려는 경우 다른 Amazon SageMaker Ground Truth 작업을 실행하여 테스트 데이터세트에 대한 매니페스트 파일을 생성할 수 있습니다. 또는 매니페스트 파일을 직접 생성할 수도 있습니다. Amazon S3 버킷 또는 로컬 컴퓨터에서 테스트 데이터 세트로 이미지를 가져올 수도 있습니다. (모델을 학습시키기 전에 이미지에 레이블이 필요할 수 있습니다.)

이 절차에서는 프로젝트에 데이터 세트가 없다고 가정합니다.

Lookout for Vision을 사용하여 데이터세트를 만들려면 (콘솔)
  1. https://console.aws.amazon.com/lookoutvision/에서 Amazon Lookout for Vision 콘솔을 엽니다.

  2. Get started를 선택합니다.

  3. 왼쪽 탐색 창에서 프로젝트를 선택합니다.

  4. 매니페스트 파일에 추가할 프로젝트를 선택합니다.

  5. 작동 방식 섹션에서 데이터세트 생성을 선택합니다.

  6. 단일 데이터 세트 탭 또는 학습 및 테스트 데이터 세트 분리 탭을 선택하고 단계를 따르세요.

    Single dataset
    1. 단일 데이터 세트 만들기를 선택합니다.

    2. 이미지 소스 구성 섹션에서 SageMakerGround Truth로 레이블이 지정된 이미지 가져오기를 선택합니다.

    3. .manifest 파일 위치의 경우 Amazon SageMaker Ground Truth를 사용하여 이미지에 레이블 지정의 6단계에서 기록해 둔 매니페스트 파일의 위치를 입력합니다.

    Separate training and test datasets
    1. 교육 데이터세트 및 테스트 데이터세트 만들기를 선택합니다.

    2. 교육 데이터세트 세부 정보 섹션에서 SageMakerGround Truth로 레이블이 지정된 이미지 가져오기를 선택합니다.

    3. .manifest 파일 위치에서는 Amazon SageMaker Ground Truth를 사용하여 이미지에 레이블 지정의 6단계에서 기록해 둔 매니페스트 파일의 위치입니다.

    4. 테스트 데이터세트 세부정보 섹션에서 SageMaker Ground Truth로 레이블이 지정된 이미지 가져오기를 선택합니다.

    5. .manifest 파일 위치에서는 Amazon SageMaker Ground Truth를 사용하여 이미지에 레이블 지정의 6단계에서 기록해 둔 매니페스트 파일의 위치입니다. 테스트 데이터 세트에는 별도의 매니페스트 파일이 필요하다는 점을 기억하세요.

  7. 제출을 선택합니다.

  8. 모델 학습에 나온 단계에 따라 모델을 훈련하세요.