예측기 훈련 - Amazon Forecast

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

예측기 훈련

예측기는 대상 시계열, 관련 시계열, 항목 메타데이터 및 포함된 추가 데이터 세트를 사용하여 훈련되는 Amazon Forecast 모델입니다. 예측기를 사용하여 시계열 데이터를 기반으로 예측을 생성할 수 있습니다.

기본적으로 Amazon Forecast는 Forecast를 생성하는데 AutoPredictor, 여기서 Forecast는 데이터세트의 각 시계열에 최적의 알고리즘 조합을 적용합니다.

예측기 생성

Amazon Forecast가 예측기를 훈련하려면 다음 입력이 필요합니다.

  • 데이터 세트 그룹 - 대상 시계열 데이터 세트를 포함해야 하는 데이터 세트 그룹입니다. 대상 시계열 데이터 세트에는 대상 속성(item_id)과 타임스탬프 속성 및 차원이 포함됩니다. 관련 시계열과 항목 메타데이터는 선택 사항입니다. 자세한 설명은 데이터 세트 가져오기 섹션을 참조하세요.

  • 예측 빈도 - 예측의 세분 수준(시간별, 일별, 주별 등)입니다. 빈도 단위와 값을 제공하면 Amazon Forecast에서 예측의 정확한 세분 수준을 결정할 수 있습니다. 정수 값만 사용할 수 있습니다.

    빈도 단위 허용된 값
    분당 1-59
    시간당 1-23
    일별 1-6
    주별 1-4
    매월 1-11
    매년 1

    예를 들어, 격주로 예측하려는 경우 빈도 단위는 주별이고 값은 2입니다. 또는 분기별 예측을 원하는 경우 빈도 단위는 월별이고 값은 3입니다.

    예측 빈도보다 높은 빈도로 데이터가 수집되는 경우 데이터는 예측 빈도로 집계됩니다. 여기에는 후행 시계열 및 관련 시계열 데이터가 포함됩니다. 집계에 대한 자세한 내용은 다양한 예측 빈도의 데이터 집계 섹션을 참조하세요.

  • 예측 기간 - 예측되는 시간 단계 수입니다.

다음과 같은 선택적 입력의 값도 설정할 수 있습니다.

  • 시간 정렬 경계 - Forecast가 데이터를 집계하고 사용자가 지정한 예측 빈도에 맞는 예측을 생성하는 데 사용하는 시간 경계입니다. 집계에 대한 자세한 내용은 다양한 예측 빈도의 데이터 집계 섹션을 참조하세요. 시간 경계 지정에 대한 자세한 내용은 시간 경계 섹션을 참조하세요.

  • 예측 차원 - 차원은 대상 시계열 데이터 세트의 선택적 속성으로, 대상 값(item_id)과 함께 사용하여 별도의 시계열을 생성할 수 있습니다.

  • 예측 유형 - 예측기를 평가하는 데 사용되는 분위수입니다.

  • 최적화 지표 - 예측기를 최적화하는 데 사용되는 정확도 지표입니다.

  • 추가 데이터 세트 - 날씨 지수와 공휴일 같은 기본 제공 Amazon Forecast 데이터 세트입니다.

소프트웨어 개발 키트(SDK) 또는 Amazon Forecast 콘솔을 사용하여 예측기를 생성할 수 있습니다.

Console

예측기를 생성하려면

  1. AWS Management Console에 로그인하고 https://console.aws.amazon.com/forecast/에서 Amazon Forecast 콘솔을 엽니다.

  2. 데이터 세트 그룹에서 데이터 세트 그룹을 선택합니다.

  3. 탐색 창에서 예측기를 선택합니다.

  4. 새 예측기 훈련을 선택합니다.

  5. 다음 필수 필드에 값을 입력합니다.

    • 이름 - 고유한 예측기 이름입니다.

    • 예측 빈도 - 예측의 세분 수준입니다.

    • 예측 기간 - 예측할 시간 단계 수입니다.

  6. 시작을 선택합니다.

추가 데이터 세트에 대한 자세한 내용은 날씨 지수공휴일 특성화 섹션을 참조하세요. 예측 유형 및 최적화 지표를 사용자 지정하는 방법에 대한 자세한 내용은 예측기 정확성 평가 섹션을 참조하세요.

AWS CLI

AWS CLI를 사용하여 자동 예측기를 생성하려면 create-predictor 명령을 사용합니다. 다음 코드는 장래의 14일에 대해 예측하는 자동 예측기를 생성합니다.

예측기 이름과 훈련 데이터가 포함된 데이터 세트 그룹의 Amazon 리소스 이름(ARN)을 입력합니다. 필요에 따라 예측 기간과 예측 빈도를 수정할 수 있습니다. 필요에 따라 예측기의 태그를 추가합니다. 자세한 내용은 Amazon Forecast 리소스 태그 지정 섹션을 참조하세요.

필수 및 선택적 파라미터에 대한 자세한 내용은 CreateAutoPredictor 섹션을 참조하세요.

aws forecast create-predictor \ --predictor-name predictor_name \ --data-config DatasetGroupArn="arn:aws:forecast:region:account:dataset-group/datasetGroupName" \ --forecast-horizon 14 \ --forecast-frequency D \ --tags Key=key1,Value=value1 Key=key2,Value=value2

예측 유형 및 최적화 지표를 사용자 지정하는 방법에 대한 자세한 내용은 예측기 정확성 평가 섹션을 참조하세요. 날씨 지수 및 공휴일 추가 데이터 세트는 DataConfig 데이터 형식 내에 정의되어 있습니다. 추가 데이터 세트에 대한 자세한 내용은 날씨 지수공휴일 특성화 섹션을 참조하세요.

Python

SDK for Python(Boto3)으로 자동 예측기를 생성하려면 create_auto_predictor 메서드를 사용합니다. 다음 코드는 장래의 14일에 대해 예측하는 자동 예측기를 생성합니다.

예측기 이름과 훈련 데이터가 포함된 데이터 세트 그룹의 Amazon 리소스 이름(ARN)을 입력합니다. 필요에 따라 예측 기간과 예측 빈도를 수정할 수 있습니다. 필요에 따라 예측기의 태그를 추가합니다. 자세한 내용은 Amazon Forecast 리소스 태그 지정 섹션을 참조하세요.

필수 및 선택적 파라미터에 대한 자세한 내용은 CreateAutoPredictor 섹션을 참조하세요.

import boto3 forecast = boto3.client('forecast') create_predictor_response = forecast.create_auto_predictor( PredictorName = 'predictor_name', ForecastHorizon = 14, ForecastFrequency = 'D', DataConfig = { "DatasetGroupArn": "arn:aws:forecast:region:account:dataset-group/datasetGroupName" }, Tags = [ { "Key": "key1", "Value": "value1" }, { "Key": "key2", "Value": "value2" } ] ) print(create_predictor_response['PredictorArn'])

예측 유형 및 최적화 지표를 사용자 지정하는 방법에 대한 자세한 내용은 예측기 정확성 평가 섹션을 참조하세요. 날씨 지수 및 공휴일 추가 데이터 세트는 DataConfig 데이터 형식 내에 정의되어 있습니다. 추가 데이터 세트에 대한 자세한 내용은 날씨 지수공휴일 특성화 섹션을 참조하세요.

로 업그레이드 AutoPredictor

Python 노트북

예측자를 로 업그레이드하는 방법에 대한 step-by-step 지침은 예측자 업그레이드를 참조하십시오. AutoPredictor AutoPredictor

AutoML 또는 수동 선택 CreatePredictor () 으로 만든 예측자를 로 업그레이드할 수 있습니다. AutoPredictor 기존 버전을 AutoPredictor 업그레이드하면 관련된 모든 예측자 구성 설정이 전송됩니다.

로 AutoPredictor 업그레이드한 후에도 원래 예측자는 활성 상태로 유지되며 업그레이드된 예측자는 별도의 예측자 ARN을 갖게 됩니다. 이렇게 하면 두 예측기 간에 정확도 지표를 비교할 수 있고, 원래 예측기로 계속 예측을 생성할 수 있습니다.

소프트웨어 개발 키트(SDK) 또는 Amazon Forecast 콘솔을 사용하여 예측기를 업그레이드할 수 있습니다.

Console

예측기를 업그레이드하려면

  1. AWS Management Console에 로그인하고 https://console.aws.amazon.com/forecast/에서 Amazon Forecast 콘솔을 엽니다.

  2. 탐색 창에서 예측기를 선택합니다.

  3. 업그레이드할 예측기를 선택하고 업그레이드를 선택합니다.

  4. 업그레이드된 예측기의 고유한 이름을 설정합니다.

  5. Upgrade to를 선택합니다. AutoPredictor

CLI

AWS CLI를 사용하여 예측기를 업그레이드하려면 create-predictor 메서드를 사용하되, 예측기 이름과 reference-predictor-arn 값만(업그레이드하려는 예측기의 ARN) 지정하세요.

aws forecast create-predictor \ --predictor-name predictor_name \ --reference-predictor-arn arn:aws:forecast:region:account:predictor/predictorName
Python

SDK for Python(Boto3)을 사용하여 예측기를 업그레이드하려면 create_auto_predictor 메서드를 사용하되, 예측기 이름과 ReferencePredictorArn 값만(업그레이드하려는 예측기의 ARN) 지정하세요.

import boto3 forecast = boto3.client('forecast') create_predictor_response = forecast.create_auto_predictor( PredictorName = 'predictor_name', ReferencePredictorArn = 'arn:aws:forecast:region:account:predictor/predictorName' ) print(create_predictor_response['PredictorArn'])

추가 데이터 세트 사용

Amazon Forecast는 예측기를 생성할 때 날씨 지수 및 공휴일을 포함할 수 있습니다. 날씨 지수는 기상 정보를 모델에 통합하고 공휴일은 국경일에 관한 정보를 통합합니다.

날씨 지수에는 대상 시계열 데이터 세트의 '지리적 위치' 속성과 타임스탬프의 시간대 관련 정보가 필요합니다. 자세한 설명은 날씨 지수 섹션을 참조하세요.

공휴일에는 250개 이상 국가의 공휴일 정보가 포함됩니다. 자세한 설명은 공휴일 특성화 섹션을 참조하세요.

레거시 예측기 작업

참고

기존 예측자를 로 AutoPredictor 업그레이드하려면 을 참조하십시오. 로 업그레이드 AutoPredictor

AutoPredictor Amazon Forecast를 사용하여 예측자를 생성할 때 선호되는 기본 방법입니다. AutoPredictor 데이터세트의 각 시계열에 대해 최적의 알고리즘 조합을 적용하여 예측자를 생성합니다.

로 만든 AutoPredictor 예측자는 일반적으로 AutoML 또는 수동 선택으로 만든 예측자보다 정확합니다. 예측 설명 가능성 및 예측 변수 재훈련 기능은 를 사용하여 만든 예측 변수에만 사용할 수 있습니다. AutoPredictor

Amazon Forecast는 다음과 같은 방법으로 레거시 예측기도 생성할 수 있습니다.

  1. AutoML - Forecast가 가장 성능이 좋은 알고리즘을 찾아 전체 데이터 세트에 적용합니다.

  2. 수동 선택 - 전체 데이터 세트에 적용되는 단일 알고리즘을 수동으로 선택합니다.

소프트웨어 개발 키트(SDK)를 사용하여 레거시 예측기를 생성할 수도 있습니다.

SDK

AutoML을 사용하려면

CreatePredictor 작업을 사용하여 PerformAutoML의 값을 "true"로 설정합니다.

{ ... "PerformAutoML": "true", }

AutoML을 사용하는 경우,AlgorithmArn, HPOConfig 다음 CreatePredictor 매개변수의 값을 설정할 수 없습니다. TrainingParameters