기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
입력 매니페스트 파일 사용
입력 매니페스트 파일의 각 줄은 레이블을 지정할 객체 또는 객체에 대한 참조를 포함하는 항목입니다. 항목에는 이전 작업의 레이블과 일부 작업 유형의 경우 추가 정보가 포함될 수도 있습니다.
입력 데이터 및 매니페스트 파일이 Amazon Simple Storage Service (Amazon S3) 에 저장되어야 합니다. 각 시스템에는 다음과 같은 특정 스토리지 및 액세스 요구 사항이 있습니다.
-
입력 데이터가 포함되어 있는 Amazon S3 버킷은 Amazon SageMaker Ground Truth를 실행 중인AWS 리전과 동일한 리전에 있어야 합니다. Amazon S3 버킷에 저장된 데이터를 읽을 수 있도록 Amazon S3 버킷에 저장된 데이터에 SageMaker 대한 액세스 권한을 부여해야 합니다. Amazon S3 버킷에 대한 자세한 내용은 Amazon S3 버킷 사용을 참조하십시오.
-
매니페스트 파일은 데이터 파일과 동일한AWS 지역에 있어야 하지만 데이터 파일과 같은 위치에 있을 필요는 없습니다. 레이블 지정 작업을 생성할 때 Ground Truth에 할당한AWS Identity and Access Management (IAM) 역할에 액세스할 수 있는 모든 Amazon S3 버킷에 저장할 수 있습니다.
참고
3D 포인트 클라우드 및 비디오 프레임 작업 유형에는 입력 매니페스트 요구 사항 및 속성이 다릅니다.
3D 포인트 클라우드 작업 유형에 대한 내용은 을 참조하십시오3D 포인트 클라우드 레이블 지정 작업에 대한 입력 매니페스트 파일 생성.
비디오 프레임 작업 유형에 대한 내용은 을 참조하십시오비디오 프레임 입력 매니페스트 파일 만들기.
매니페스트는 각 줄이 완전하고 유효한 JSON 객체인 UTF-8 인코딩 파일입니다. 각 행은 표준 줄 바꿈인 \n 또는 \r\n으로 구분됩니다. 각 행이 유효한 JSON 객체여야 하므로 이스케이프되지 않은 줄 바꿈 문자를 사용할 수 없습니다. 데이터 형식에 대한 자세한 정보는 JSON 라인
매니페스트 파일의 각 JSON 객체는 100,000자를 초과할 수 없습니다. 객체 내 단일 속성은 20,000자를 초과할 수 없습니다. 속성 이름은 $
(달러 기호)로 시작할 수 없습니다.
매니페스트 파일의 각 JSON 객체에는 source-ref
또는 source
키 중 하나가 포함되어야 합니다. 키 값은 다음과 같이 해석됩니다.
-
source-ref
— 객체 소스는 값에 지정된 Amazon S3 객체입니다. 객체가 이미지와 같은 이진 객체인 경우 이 값을 사용합니다. -
source
— 객체의 소스는 값입니다. 객체가 문자 값일 때 이 값을 사용하십시오.
다음은 Amazon S3 버킷에 저장된 파일의 매니페스트 파일의 예입니다.
{"source-ref": "
S3 bucket location 1
"} {"source-ref": "S3 bucket location 2
"} ... {"source-ref": "S3 bucket location n
"}
바운딩 박스, 이미지 분류 (단일 및 다중 레이블), 시맨틱 세분화를 위한 이미지 파일 및 비디오 분류 레이블 지정 작업용 비디오 클립의source-ref
키를 사용하십시오. 3D 포인트 클라우드 및 비디오 프레임 라벨링 작업도source-ref
키를 사용하지만 이러한 라벨링 작업에는 입력 매니페스트 파일에 추가 정보가 필요합니다. 자세한 내용은 3D 포인트 클라우드 입력 데이터 및 비디오 프레임 입력 데이터 단원을 참조하세요.
다음은 매니페스트에 저장된 입력 데이터와 함께 매니페스트 파일의 예입니다.
{"source": "
Lorem ipsum dolor sit amet
"} {"source": "consectetur adipiscing elit
"} ... {"source": "mollit anim id est laborum
"}
단일 및 다중 레이블 텍스트 분류 및 명명된 엔티티 인식 레이블 지정 작업에source
키를 사용하십시오.
매니페스트 파일에는 다른 키-값 페어를 포함할 수 있습니다. 이러한 페어는 출력 파일에 변경 없이 전달되며, 애플리케이션 간에 정보를 전달하려 할 때 유용합니다. 자세한 정보는 출력 데이터을 참조하세요.