미리 정의된 데이터 세트 도메인 및 데이터 세트 유형 - Amazon Forecast

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

미리 정의된 데이터 세트 도메인 및 데이터 세트 유형

예측기를 교육하려면 하나 이상의 데이터 세트를 생성하여 데이터 세트 그룹에 추가하고 교육용 데이터 세트를 제공하십시오.

생성한 각 데이터 세트에 대해 데이터 세트 도메인과 데이터 세트 유형을 연결합니다. 데이터 세트 도메인은 일반 사용 사례에 대해 미리 정의된 데이터 세트 스키마를 지정하며 모델 알고리즘 또는 하이퍼파라미터에는 영향을 주지 않습니다.

Amazon Forecast는 다음 데이터 세트 도메인을 지원합니다.

각 도메인에 대해 1 - 3개의 데이터 세트 유형이 있습니다. 도메인용으로 생성하는 데이터 세트 유형은 보유한 데이터 유형과 교육에 포함하려는 유형에 따라 다릅니다.

각 도메인에는 대상 시계열 데이터 세트가 필요하며 선택적으로 관련 시계열 및 항목 메타데이터 세트 데이터 세트 유형을 지원합니다.

데이터 세트 유형은 다음과 같습니다.

  • 대상 시계열 - 유일한 필수 데이터 세트 유형입니다. 이 유형은 예측을 생성하려는 대상 필드입니다. 예를 들어 일련의 제품에 대한 판매량을 예상하려면 각 제품에 대한 과거 시계열 데이터의 데이터 세트를 생성해야 합니다. 이와 마찬가지로 예측할 수익, 현금 흐름, 판매 같은 지표에 대해 대상 시계열 데이터 세트를 생성할 수 있습니다.

  • 관련 시계열 - 대상 시계열 데이터와 관련된 시계열 데이터입니다. 예를 들어, 가격은 제품 판매 데이터와 관련되어 있으므로 관련 시계열로 제공할 수 있습니다.

  • 항목 메타데이터 - 대상 시계열 데이터에 적용할 수 있는 메타데이터입니다. 예를 들어, 특정 제품의 판매를 예측하는 경우 브랜드, 색상, 장르와 같은 제품의 속성이 항목 메타데이터의 일부가 됩니다. EC2 인스턴스의 EC2 용량을 예측할 때 메타데이터에는 인스턴스 유형의 CPU 및 메모리가 포함될 수 있습니다.

각 데이터 세트 유형에 대해 입력 데이터에는 일정한 필수 필드가 포함되어야 합니다. Amazon Forecast에서 제안하는 선택적 필드를 포함할 수도 있습니다.

다음 예제에서는 데이터 세트 도메인 및 해당 데이터 세트 유형을 선택하는 방법을 보여줍니다.

예제 1: RETAIL 도메인의 데이터 세트 유형

품목에 대한 수요 예측에 관심이 있는 소매업체인 경우 RETAIL 도메인에 다음 데이터 세트를 생성할 수 있습니다.

  • 대상 시계열은 각 항목(소매업체가 판매하는 각 제품)에 대한 과거 시계열 수요(판매) 데이터의 필수 데이터 세트입니다. RETAIL 도메인에서 이 데이터 세트 유형은 데이터 세트에 item_id, timestampdemand 필드가 포함되어야 합니다. demand 필드는 예측 대상이며 일반적으로 특정 주 또는 요일에 소매업체가 판매하는 품목의 수입니다.

  • 선택적으로 관련 시계열 유형의 데이터 세트입니다. RETAIL 도메인에서 이 유형은 price, inventory_onhand 및, webpage_hits와 같이 선택적이지만 제안하는 시계열 정보를 포함할 수 있습니다.

  • 선택적으로 항목 메타데이터 유형의 데이터 세트입니다. RETAIL 도메인에서 Amazon Forecast는 대상 시계열에서 제공한 항목(예: brand, color, categorygenre)과 관련된 메타데이터 정보를 제공할 것을 제안합니다.

예제 2: METRICS 도메인의 데이터 세트 유형

수익, 판매, 현금 흐름과 같은 조직의 주요 지표를 예측하려는 경우 Amazon Forecast에 다음 데이터 세트를 제공할 수 있습니다.

  • 예측하려는 지표에 대한 과거 시계열 데이터를 제공하는 대상 시계열 데이터 세트입니다. 조직의 모든 비즈니스 단위의 수익을 예상하려는 경우 metric, business unitmetric_value 필드로 target time series 데이터 세트를 생성할 수 있습니다.

  • category 또는 location와 같이 각 지표에 대해 메타데이터가 필요하지 않은 경우 관련 시계열 및 항목 메타데이터 유형의 데이터 세트를 제공할 수 있습니다.

Forecast가 대상 지표에 대한 예측을 생성하려면 최소한 대상 시계열 데이터 세트를 제공해야 합니다.

예제 3: CUSTOM 도메인의 데이터 세트 유형

예상 애플리케이션의 교육 데이터는 Amazon Forecast 도메인에 적합하지 않을 수도 있습니다. 이 경우 CUSTOM 도메인을 선택하십시오. 대상 시계열 데이터 세트를 제공해야 하지만 자신만의 사용자 지정 필드를 추가할 수 있습니다.

시작하기 연습에서는 클라이언트의 전기 사용량을 예상합니다. 전기 사용량 교육 데이터는 데이터 세트 도메인에 맞지 않으므로 CUSTOM 도메인을 사용했습니다. 이 연습에서는 대상 시계열 유형의 데이터 세트 유형 하나만 사용합니다. 데이터 필드를 데이터 세트 유형에 필요한 최소 필드에 매핑합니다.