기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
데이터 세트 준비
어댑터를 만들려면 Rekognition에 교육 데이터 세트와 테스트 데이터 세트, 두 개의 데이터 세트를 제공해야 합니다. 각 데이터 세트는 이미지와 주석 또는 레이블이라는 두 가지 요소로 구성됩니다. 다음 섹션에서는 레이블과 이미지의 용도와 이들을 결합하여 데이터 세트를 생성하는 방법을 설명합니다.
이미지
이미지의 대표적인 샘플을 기반으로 어댑터를 훈련시켜야 합니다. 훈련용 이미지를 선택할 때는 어댑터로 얻고자 하는 각 레이블의 예상 응답을 보여주는 이미지를 최소한 몇 개 포함시키세요.
훈련 데이터 세트를 만들려면 다음 두 이미지 유형 중 하나를 제공해야 합니다.
-
False Positive 예측이 포함된 이미지. 기본 모델이 이미지 안에 술이 있다고 예측했지만 실제로는 그렇지 않은 경우를 예로 들 수 있습니다.
-
False Negative 예측이 포함된 이미지. 기본 모델이 이미지 안에 술이 없다고 예측했지만 실제로는 술이 있는 경우를 예로 들 수 있습니다.
균형 잡힌 데이터 세트를 만들려면 다음 두 이미지 유형 중 하나를 제공하는 것이 좋습니다.
-
True Positive 예측이 포함된 이미지. 기본 모델이 이미지 안에 술이 있다고 올바르게 예측한 경우를 예로 들 수 있습니다. False Positive 이미지를 제공하는 경우 이러한 이미지도 제공하는 것이 좋습니다.
-
True Negative 예측이 포함된 이미지. 기본 모델이 이미지 안에 술이 없다고 올바르게 예측한 경우를 예로 들 수 있습니다. False Negative 이미지를 제공하는 경우 이러한 이미지도 제공하는 것이 좋습니다.
레이블
레이블은 객체, 이벤트, 개념 또는 활동을 가리킵니다. 콘텐츠 조절에서 레이블은 부적절하거나, 원치 않거나, 불쾌감을 주는 콘텐츠의 인스턴스입니다.
Rekognition의 기본 모델을 훈련시켜 어댑터를 만드는 상황에서는 이미지에 레이블이 할당되는 것을 주석이라고 합니다. Rekognition 콘솔로 어댑터를 훈련시키는 경우 콘솔을 사용하여 레이블을 선택한 다음 레이블에 해당하는 이미지에 태그를 지정하여 이미지에 주석을 추가합니다. 이 프로세스를 통해 모델은 할당된 레이블을 기반으로 이미지의 요소를 식별하는 법을 배우게 됩니다. 이 연결 프로세스는 어댑터가 생성되고 나면 모델이 가장 관련성이 높은 콘텐츠에 집중할 수 있도록 하므로 이미지 분석의 정확도가 향상됩니다.
또는 이미지에 대한 정보와 함께 제공되는 주석이 포함된 매니페스트 파일을 제공할 수도 있습니다.
훈련 데이터 세트 및 테스트 데이터 세트
훈련 데이터 세트는 모델을 미세 조절하고 사용자 지정 어댑터를 만들기 위한 기초가 됩니다. 모델이 학습할 수 있도록 주석이 달린 훈련 데이터 세트를 제공해야 합니다. 모델은 이 데이터 세트를 기반으로 학습하여 사용자가 제공하는 이미지 유형에 대한 성능을 개선합니다.
정확도를 높이려면 이미지에 주석을 달거나 레이블을 지정하여 훈련 데이터 세트를 만들어야 합니다. 다음 두 가지 방법으로 이 작업을 수행할 수 있습니다.
수동 레이블 할당 - 데이터 세트에 포함할 이미지를 업로드한 후 이러한 이미지에 수동으로 레이블을 할당하여 Rekognition 콘솔을 사용한 훈련 데이터 세트를 생성할 수 있습니다.
매니페스트 파일 - 매니페스트 파일을 사용하여 어댑터를 훈련할 수 있습니다. 매니페스트 파일에는 훈련 이미지 및 테스트 이미지의 실측 정보 주석과 훈련 이미지의 위치에 대한 정보가 들어 있습니다. Rekognition APIs를 사용하여 어댑터를 훈련하거나 AWS 콘솔을 사용할 때 매니페스트 파일을 제공할 수 있습니다.
테스트 데이터 세트는 훈련 후 어댑터의 성능을 평가하는 데 사용됩니다. 신뢰성 있는 평가를 보장하기 위해 모델이 본 적 없는 원본 훈련 데이터 세트의 일부를 사용하여 테스트 데이터 세트를 만듭니다. 이 프로세스를 통해 새 데이터로 어댑터의 성능을 평가하여 정확한 측정치 및 지표를 생성할 수 있습니다. 최적 정확도 개선에 대해서는 어댑터 훈련 모범 사례 섹션을 참조하세요.