예측에 대해 - Amazon Forecast에서 시계열 예측 원칙

예측에 대해

이 문서에서 예측이란 시계열의 미래 값 예측을 의미합니다. 문제에 대한 입력 또는 출력은 시계열 특성을 갖습니다.

예측 시스템

예측 시스템에는 다음과 같은 다양한 사용자가 포함됩니다.

  • 최종 사용자: 특정 제품에 대한 예측을 쿼리하고 구매할 제품 수를 결정합니다. 이는 사람일 수도 있고 자동화된 시스템일 수도 있습니다.

  • 비즈니스 분석가/비즈니스 인텔리전스: 최종 사용자를 지원하며 집계 보고를 실행하고 구성합니다.

  • 데이터 과학자: 수요 패턴과 인과 관계를 반복적으로 분석하고 새로운 기능을 추가하여 모델을 점진적으로 개선하거나 예측 모델을 개선합니다.

  • 엔지니어: 데이터 수집의 인프라를 설정하고 시스템에 입력 데이터의 가용성을 보장합니다.

Amazon Forecast는 소프트웨어 엔지니어의 작업을 줄여 주며 데이터 과학 역량이 제한된 기업에서도 최신 예측 기술을 활용할 수 있도록 합니다. 데이터 과학 역량을 갖춘 기업의 경우 Amazon Forecast에 포함된 다양한 진단 기능을 통해 예측 문제를 잘 해결할 수 있습니다.

예측 문제는 어디에서 발생하나요?

예측 문제는 자연적으로 시계열 데이터를 생성하는 여러 영역에서 발생합니다. 여기에는 소매 판매, 의료 분석, 용량 계획, 센서 네트워크 모니터링, 재무 분석, 소셜 활동 마이닝 및 데이터베이스 시스템이 포함됩니다. 예를 들어 예측은 데이터 기반 의사 결정을 지원하는 대부분의 비즈니스에서 운영 프로세스를 자동화하고 최적화하는 데 중요한 역할을 합니다. 제품 공급 및 수요에 대한 예측은 최적의 재고 관리, 직원 일정 관리 및 토폴로지 계획에 사용될 수 있으며, 일반적으로 공급망 최적화의 대부분 측면에서 중요한 기술입니다.

다음 그림은 패턴(이 예에서는 계절성)을 나타내는 관측된 시계열을 기반으로 특정 기간 동안 예측이 생성될 때 발생하는 예측 문제에 대한 요약을 보여 줍니다. 가로축은 과거(왼쪽)에서 미래(오른쪽)로 이동하는 시간을 나타냅니다. 세로축은 측정된 단위를 나타냅니다. 검은색 수직선까지의 과거(파란색)를 고려하여 미래(빨간색)를 식별하는 것이 예측 과제입니다.

예측 작업 개요를 보여주는 다이어그램

예측 작업 개요

예측 문제를 해결하기 전에 고려할 사항

예측 문제를 해결하기 전에 이해해야 할 가장 중요한 질문은 다음과 같습니다.

  • 예측 문제를 해결해야 하나요?

  • 예측 문제를 해결하는 이유는 무엇인가요?

시계열 데이터가 어디에나 있기 때문에 어디서나 예측 문제를 쉽게 찾을 수 있습니다. 그러나 핵심 질문은 예측 문제를 해결할 필요가 있는지 또는 비즈니스의 효율적인 의사 결정에 영향을 미치지 않으면서 예측 문제를 완전히 피할 수 있는지 여부입니다. 과학적으로 말하자면 예측은 기계 학습에서 가장 어려운 문제 중 하나이기 때문에 이 질문을 던지는 것이 중요합니다.

예를 들어 온라인 소매업체를 위한 제품 추천을 고려해 보겠습니다. 이 제품 추천 문제는 각 고객 재고 관리 단위(SKU) 쌍에 대해 특정 고객이 구매할 특정 항목의 개수를 예측하는 예측 문제로 간주할 수 있습니다. 이 문제 공식화에는 여러 가지 이점이 있습니다. 한 가지 이점은 시간 구성 요소가 명시적으로 고려되므로 고객의 구매 패턴에 따라 제품을 추천할 수 있다는 것입니다.

그러나 제품 추천 문제를 예측 문제로 공식화하는 경우는 거의 없습니다. 이러한 예측 문제를 해결하는 것은 추천 문제를 직접 해결하는 것보다 훨씬 어렵기 때문입니다(예: 고객-SKU 수준에서의 정보 희소성 및 문제의 규모). 따라서 예측 애플리케이션을 생각할 때는 예측의 다운스트림 사용량을 고려하고 대체 접근 방식을 사용하여 이 문제를 해결할 수 있는지 여부를 고려하는 것이 중요합니다.

이 경우 Amazon Personalize가 도움이 될 수 있습니다. Amazon Personalize는 개발자가 애플리케이션을 사용하는 개별 고객에게 맞는 추천을 쉽게 생성할 수 있는 기계 학습 서비스입니다.

예측 문제를 해결해야 한다고 판단한 후 다음으로 던져야 할 질문은 예측 문제를 해결하는 이유에 대한 것입니다. 많은 비즈니스 환경에서 예측은 일반적으로 목적을 달성하기 위한 수단에 불과합니다. 예를 들어, 소매 상황에서 수요 예측의 경우 예측을 사용하여 재고 관리 결정을 내릴 수 있습니다. 예측 문제는 일반적으로 의사 결정 문제에 대한 입력이며, 이는 다시 최적화 문제로 모델링될 수 있습니다.

이러한 의사 결정 문제의 예로는 구매할 상품 수량이나 기존 재고를 처리하기 위한 최선의 방법이 포함됩니다. 기타 비즈니스 예측 문제에는 서버 용량 예측 또는 제조 상황에서의 원자재/부품 수요 예측이 포함됩니다. 이러한 예측은 위와 같은 의사 결정 문제 또는 시나리오 시뮬레이션에 대한 다른 프로세스의 입력으로 사용될 수 있으며, 이러한 정보는 명시적 모델 없이 계획 수립에 사용될 수 있습니다. 예측이 그 자체로 끝이 아니라는 규칙에는 예외가 있습니다. 예를 들어 재무 예측에서 예측은 재무 준비금을 모으는 데 직접 사용되거나 투자자에게 제공됩니다.

예측의 목적을 이해하려면 다음 질문을 고려하세요.

  • 얼마나 오랫동안 미래를 예측해야 하나요?

  • 얼마나 자주 예측을 생성해야 하나요?

  • 예측에서 자세히 살펴봐야 할 특정 측면이 있나요?