자동화된 데이터 설정 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

자동화된 데이터 설정

Amazon S3에 저장된 이미지, 동영상, 동영상 프레임, 텍스트(.txt) 파일 및 쉼표로 구분된 값(.csv) 파일을 사용하여 Ground Truth 콘솔에서 레이블 지정 작업을 위한 매니페스트 파일을 생성하는 데 자동화된 데이터 설정을 사용할 수 있습니다. 자동화된 데이터 설정을 사용하는 경우 입력 데이터가 저장되는 Amazon S3 위치와 입력 데이터 유형을 지정하면 Ground Truth는 지정한 위치에서 해당 유형과 일치하는 파일을 찾습니다.

참고

Ground Truth는 AWS KMS 키를 사용하여 입력 데이터에 액세스하거나 지정한 Amazon S3 위치에 입력 매니페스트 파일을 작성하지 않습니다. 레이블 지정 작업을 생성하는 사용자 또는 역할에는 Amazon S3의 입력 데이터 객체에 액세스할 수 있는 권한이 있어야 합니다.

다음 절차를 사용하기 전에 입력 이미지 또는 파일의 형식이 올바른지 확인하세요.

  • 이미지 파일 – 이미지 파일은 입력 파일 크기 할당량에 있는 표에 나열된 크기 및 해상도 제한을 준수해야 합니다.

  • 텍스트 파일 – 텍스트 데이터는 하나 이상의.txt 파일에 저장할 수 있습니다. 레이블을 지정할 각 항목은 표준 줄 바꿈으로 구분해야 합니다.

  • CSV 파일 – 텍스트 데이터는 하나 이상의.csv 파일에 저장할 수 있습니다. 레이블을 지정할 각 항목은 별도의 행에 있어야 합니다.

  • 동영상 - 동영상 파일은..mp4, .ogg, .webm. 형식 중 하나일 수 있습니다. 객체 감지 또는 객체 추적을 위해 동영상 파일에서 동영상 프레임을 추출하려는 경우 비디오 파일 제공 단원을 참조하세요.

  • 동영상 프레임 - 동영상 프레임은 동영상에서 추출한 이미지입니다. 단일 동영상에서 추출한 모든 이미지를 동영상 프레임 시퀀스라고 합니다. Amazon S3의 각 동영상 프레임 시퀀스에는 고유한 접두사 키가 있어야 합니다. 동영상 프레임 제공을 참조하세요. 이 데이터 유형의 경우 자동 동영상 프레임 입력 데이터 설정을 참조하세요.

중요

동영상 프레임 객체 감지 및 동영상 프레임 객체 추적 레이블 지정 작업의 경우 자동화된 데이터 설정 사용 방법을 알아보려면 자동 동영상 프레임 입력 데이터 설정을 참조하세요.

다음 지침에 따라 Ground Truth와의 입력 데이터 세트 연결을 자동으로 설정합니다.

Amazon S3의 데이터를 Ground Truth와 자동으로 연결
  1. Amazon SageMaker 콘솔의 https://console.aws.amazon.com/sagemaker/ 에서 라벨 제작 작업 생성 페이지로 이동하십시오.

    이 링크를 클릭하면 노스 버지니아 (us-east-1) 지역으로 이동할 수 있습니다. AWS 입력 데이터가 다른 리전에서 Amazon S3 버킷에 있는 경우 해당 리전에서 실행할 수 있습니다. AWS 지역을 변경하려면 탐색 표시줄에서 현재 표시된 지역의 이름을 선택합니다.

  2. 레이블 지정 작업 생성을 선택합니다.

  3. 작업 이름을 입력합니다.

  4. 입력 데이터 설정 섹션에서 자동화된 데이터 설정을 선택합니다.

  5. 입력 데이터 세트의 S3 위치에 Amazon S3 URI를 입력합니다.

  6. 출력 데이터 세트의 S3 위치를 지정하세요. 이는 출력 데이터가 저장되는 곳입니다.

  7. 드롭다운 목록을 사용하여 데이터 유형을 선택합니다.

  8. IAM 역할 아래의 드롭다운 메뉴를 사용하여 실행 역할을 선택합니다. 새 역할 생성을 선택하는 경우 이 역할에 액세스 권한을 부여할 Amazon S3 버킷을 지정합니다. 이 역할에는 5단계 및 6단계에서 지정한 S3 버킷에 액세스할 권한이 있어야 합니다.

  9. 데이터 설정 완료를 선택합니다.

이는 5단계에서 지정한 입력 데이터 세트의 Amazon S3 위치에 입력 매니페스트를 생성합니다. SageMaker API 또는 AWS CLI, 또는 AWS SDK를 사용하여 레이블 지정 작업을 생성하는 경우 이 입력 매니페스트 파일의 Amazon S3 URI를 파라미터 입력으로 사용합니다. ManifestS3Uri

다음 GIF는 이미지 데이터에 자동화된 데이터 설정을 사용하는 방법을 보여줍니다. 이 예제는 YYMMDDTHHmmSS 형식으로 입력 매니페스트 파일이 생성된 연도(YY), 월(MM), 일(DD) 및 시(HH), 분(mm), 초(ss)를 나타내는 Amazon S3 버킷 example-groundtruth-images에 파일 dataset-YYMMDDTHHMMSS.manifest을 생성합니다.