입력 매니페스트 파일 사용 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

입력 매니페스트 파일 사용

입력 매니페스트 파일의 각 줄은 레이블을 지정할 객체 또는 객체에 대한 참조를 포함하는 항목입니다. 항목에는 이전 작업의 레이블과 일부 태스크 유형의 경우 추가 정보가 포함될 수도 있습니다.

입력 데이터 및 매니페스트 파일은 Amazon Simple Storage Service(Amazon S3)에 저장해야 합니다. 각 시스템에는 다음과 같은 특정 스토리지 및 액세스 요구 사항이 있습니다.

  • 입력 데이터가 포함된 S3 버킷은 Amazon SageMaker Ground Truth를 실행 중인 리전과 동일한 AWS 리전에 있어야 합니다. Amazon S3 버킷에 저장된 데이터를 읽을 수 있도록 Amazon SageMaker 액세스 권한을 부여해야 합니다. Amazon S3 버킷에 대한 자세한 정보는 Amazon S3 버킷 작업을 참조하십시오.

  • 매니페스트 파일은 데이터 파일과 동일한 AWS 리전에 있어야 하지만 데이터 파일과 동일한 위치에 있을 필요는 없습니다. 레이블 지정 작업을 생성할 때 Ground Truth에 할당한 AWS Identity and Access Management(IAM) 역할에 액세스할 수 있는 모든 Amazon S3 버킷에 저장할 수 있습니다.

참고

3D 포인트 클라우드 및 동영상 프레임 태스크 유형에는 서로 다른 입력 매니페스트 요구 사항 및 속성이 있습니다.

3D 포인트 클라우드 태스크 유형3D 포인트 클라우드 레이블 지정 작업에 대한 입력 매니페스트 파일 생성 단원을 참조하십시오.

동영상 프레임 작업 유형동영상 프레임 입력 매니페스트 파일 생성 단원을 참조하십시오.

매니페스트는 각 행이 하나의 완성된 유효한 JSON 객체인 UTF-8 인코딩 파일입니다. 각 행은 표준 줄 바꿈인 \n 또는 \r\n으로 구분됩니다. 각 행이 유효한 JSON 객체여야 하므로 이스케이프되지 않은 줄 바꿈 문자를 사용할 수 없습니다. 데이터 형식에 대한 자세한 정보는 JSON 라인을 참조하십시오.

매니페스트 파일의 각 JSON 객체는 100,000자를 초과할 수 없습니다. 객체 내 단일 속성은 20,000자를 초과할 수 없습니다. 속성 이름은 $(달러 기호)로 시작할 수 없습니다.

매니페스트 파일의 각 JSON 객체에는 source-ref 또는 source 키 중 하나가 포함되어야 합니다. 키 값은 다음과 같이 해석됩니다.

  • source-ref – 객체의 소스는 값에 지정된 Amazon S3 객체입니다. 객체가 이진 객체(예: 이미지)인 경우 이 값을 사용하십시오.

  • source – 객체의 소스가 이 값입니다. 객체가 문자 값일 때 이 값을 사용하십시오.

다음은 Amazon S3 버킷에 저장된 매니페스트 파일의 예입니다.

{"source-ref": "S3 bucket location 1"} {"source-ref": "S3 bucket location 2"} ... {"source-ref": "S3 bucket location n"}

경계 상자, 이미지 분류(단일 및 다중 레이블), 의미 체계 분할 및 동영상 분류 레이블 지정 작업을 위한 동영상 클립에 source-ref 키를 사용합니다. 3D 포인트 클라우드 및 동영상 프레임 레이블 지정 작업에서도 source-ref 키를 사용하지만 이러한 레이블 지정 작업은 입력 매니페스트 파일에 추가 정보가 필요합니다. 자세한 내용은 3D 포인트 클라우드 입력 데이터동영상 프레임 입력 데이터 단원을 참조하세요.

다음은 매니페스트에 저장된 입력 데이터와 함께 매니페스트 파일의 예입니다.

{"source": "Lorem ipsum dolor sit amet"} {"source": "consectetur adipiscing elit"} ... {"source": "mollit anim id est laborum"}

단일 및 다중 레이블 텍스트 분류 및 명명된 주체 인식 레이블 지정 작업에 source 키를 사용합니다.

매니페스트 파일에는 다른 키-값 페어를 포함할 수 있습니다. 이러한 페어는 출력 파일에 변경 없이 전달되며, 애플리케이션 간에 정보를 전달하려 할 때 유용합니다. 자세한 내용은 출력 데이터 섹션을 참조하세요.