ML 모델 생성 - Amazon Machine Learning

더 이상 Amazon Machine Learning 서비스를 업데이트하거나 새 사용자를 받지 않습니다. 이 설명서는 기존 사용자에 제공되지만 더 이상 업데이트되지 않습니다. 자세한 내용은 Amazon Machine Learning이란? 단원을 참조하세요.

ML 모델 생성

데이터 소스를 생성하고 나면 ML 모델을 생성할 준비가 된 것입니다. Amazon Machine Learning 콘솔을 사용하여 모델을 생성하는 경우 기본 설정을 사용하거나 사용자 지정 옵션을 적용하여 모델을 사용자 지정할 수 있습니다.

사용자 지정 옵션에는 다음이 포함됩니다.

  • 평가 설정: Amazon ML이 ML 모델의 예측 품질을 평가하기 위해 입력 데이터의 일부를 예약하도록 선택할 수 있습니다. 평가에 대한 자세한 내용은 ML 모델 평가 단원을 참조하세요.

  • 레시피: 레시피는 Amazon ML에 모델 학습에 사용할 수 있는 속성 및 속성 변환을 알려줍니다. Amazon ML 레시피에 대한 자세한 내용은 데이터 레시피를 사용한 특성 변환 단원을 참조하세요.

  • 학습 파라미터: 파라미터는 학습 프로세스 및 결과 ML 모델의 특정 속성을 제어합니다. 학습 파라미터에 대한 자세한 내용은 학습 파라미터 단원을 참조하세요.

이러한 설정의 값을 선택하거나 지정하려면 ML 모델 생성 마법사를 사용할 때 사용자 지정 옵션을 선택합니다. Amazon ML에서 기본 설정을 적용하도록 하려면 기본값을 선택합니다.

ML 모델을 생성할 때 Amazon ML은 대상 속성의 속성 유형에 따라 사용할 학습 알고리즘 유형을 선택합니다. (대상 속성은 "정답"이 포함된 속성입니다.) 대상 속성이 이진인 경우 Amazon ML은 로지스틱 회귀 알고리즘을 사용하는 바이너리 분류 모델을 생성합니다. 대상 속성이 범주형인 경우 Amazon ML은 다항 로지스틱 회귀 알고리즘을 사용하는 다중 클래스 모델을 생성합니다. 대상 속성이 숫자인 경우 Amazon ML은 선형 회귀 알고리즘을 사용하는 회귀 모델을 생성합니다.

필수 조건

Amazon ML 콘솔을 사용하여 ML 모델을 생성하기 전에 두 개의 데이터 소스를 생성해야 하는데, 하나는 모델 학습용이고 다른 하나는 모델 평가용입니다. 아직 데이터소 스를 두 개 생성하지 않은 경우 자습서의 2단계: 학습 데이터 세트 생성 단원을 참조하세요.

기본 옵션을 사용하여 ML 모델 생성

Amazon ML에서 다음을 수행하려면 기본값 옵션을 선택합니다.

  • 입력 데이터를 분할하여 처음 70%는 학습에 사용하고 나머지 30%는 평가에 사용합니다.

  • 학습 데이터 소스에서 수집한 통계(입력 데이터 소스의 70%)를 기반으로 레시피를 추천합니다.

  • 기본 학습 파라미터 선택

기본 옵션을 선택하려면
  1. Amazon ML 콘솔에서 Amazon Machine Learning을 선택한 다음 ML 모델을 선택합니다.

  2. ML 모델 요약 페이지에서 새 ML 모델 생성을 선택합니다.

  3. 입력 데이터 페이지에서 S3 데이터를 가리키는 데이터 소스를 이미 생성했습니다가 선택되었는지 확인합니다.

  4. 표에서 데이터 소스를 선택한 다음 계속을 선택합니다.

  5. ML 모델 설정 페이지의 ML 모델 이름에서 ML 모델의 이름을 입력합니다.

  6. 학습 및 평가 설정에 대해 기본값이 선택되었는지 확인합니다.

  7. 이 평가의 이름 지정에서 평가 이름을 입력한 다음 검토를 선택합니다. Amazon ML이 마법사의 나머지 부분을 생략하고 검토 페이지로 이동합니다.

  8. 데이터를 검토하고, 모델 및 평가에 적용하지 않으려는 데이터 소스에서 복사해온 태그를 모두 삭제한 다음 완료를 선택합니다.

사용자 지정 옵션을 사용하여 ML 모델 생성

ML 모델을 사용자 지정하면 다음을 수행할 수 있습니다.

  • 나만의 레시피를 제공. 자체 레시피를 제공하는 방법에 대한 자세한 내용은 레시피 형식 참조 단원을 참조하세요.

  • 학습 파라미터 선택 학습 파라미터에 대한 자세한 내용은 학습 파라미터 단원을 참조하세요.

  • 기본 70/30 비율 이외의 학습/평가 분할 비율을 선택하거나 평가를 위해 이미 준비한 다른 데이터 소스를 제공합니다. 데이터 분리에 대한 자세한 내용은 데이터 분할 단원을 참조하세요.

이들 설정의 기본 값을 선택할 수도 있습니다.

기본 옵션을 사용하여 이미 모델을 생성한 상태에서 모델의 예측 성능을 향상시키려면 사용자 지정 옵션을 사용하여 몇 가지 사용자 지정 설정의 새 모델을 생성합니다. 예를 들어 레시피에 특성 변환을 더 추가하거나 학습 파라미터의 전달 수를 늘릴 수 있습니다.

사용자 지정 옵션을 사용하여 모델을 생성하려면
  1. Amazon ML 콘솔에서 Amazon Machine Learning을 선택한 다음 ML 모델을 선택합니다.

  2. ML 모델 요약 페이지에서 새 ML 모델 생성을 선택합니다.

  3. 데이터 소스를 이미 생성한 경우 입력 데이터 페이지에서 S3 데이터를 가리키는 데이터 소스를 이미 생성했습니다를 선택합니다. 표에서 데이터 소스를 선택한 다음 계속을 선택합니다.

    데이터 소스를 생성해야 하는 경우 내 데이터가 S3에 있고 데이터 소스를 생성해야 합니다를 선택하고 계속을 선택합니다. 데이터 소스 생성 마법사로 리디렉션됩니다. 데이터가 S3에 있는지 아니면 Redshift에 있는 지를 지정한 다음 확인을 선택합니다. 데이터 소스 생성 절차를 완료합니다.

    데이터 소스를 만든 후에는 ML 모델 생성 마법사의 다음 단계로 리디렉션됩니다.

  4. ML 모델 설정 페이지의 ML 모델 이름에서 ML 모델 이름을 입력합니다.

  5. 학습 및 평가 설정 선택에서 사용자 지정을 선택한 다음 계속을 선택합니다.

  6. 레시피 페이지에서 customize a recipe를 할 수 있습니다. 레시피를 사용자 지정하지 않으려면 Amazon ML이 자동으로 추천합니다. 계속을 선택합니다.

  7. 고급 설정 페이지에서 최대 ML 모델 크기, 최대 데이터 전달 횟수, 학습 데이터의 셔플 유형, 정규화 유형정규화 정도를 지정합니다. 이들을 지정하지 않으면 Amazon ML은 기본 학습 파라미터를 사용합니다.

    이러한 파라미터 및 기본값에 대한 자세한 내용은 학습 파라미터 단원을 참조하세요.

    계속을 선택합니다.

  8. 평가 페이지에서 ML 모델을 즉시 평가할지 여부를 지정합니다. 지금 ML 모델을 평가하지 않으려면 검토를 선택합니다.

    지금 ML 모델을 평가하려면:

    1. 이 평가 이름 지정에서 평가 이름을 입력합니다.

    2. 평가 데이터 선택에 대해 Amazon ML에서 평가를 위해 입력 데이터의 일부를 예약할지, 예약할 경우 데이터 소스를 분할할지, 아니면 평가를 위해 다른 데이터 소스를 제공할지 선택합니다.

    3. 검토를 선택합니다.

  9. 검토 페이지에서 선택 내용을 편집하고 데이터 소스에서 복사한 태그 중 모델 및 평가에 적용하지 않으려는 태그를 모두 삭제한 다음 완료를 선택합니다.

모델을 생성한 후에는 4단계: ML 모델의 예측 성능 검토 및 점수 임계값 설정 단원을 참조하세요.