문제 수립 - Amazon Machine Learning

더 이상 Amazon Machine Learning 서비스를 업데이트하거나 새 사용자를 받지 않습니다. 이 설명서는 기존 사용자에 제공되지만 더 이상 업데이트되지 않습니다. 자세한 내용은 Amazon Machine Learning이란? 단원을 참조하세요.

문제 수립

기계 학습의 첫 번째 단계는 레이블 또는 대상 대답이라고 알려진 예측 대상을 결정하는 것입니다. 제품을 제조하려는 시나리오를 상상해 볼 때 각 제품을 제조하는 것에 대한 사용자의 결정은 잠재적인 판매량에 따라 달라집니다. 이 시나리오에서는 각 제품이 얼마나 많이 구매될 것인지 예측할 수 있습니다(판매 횟수 예측). 기계 학습을 사용하여 이 문제를 정의하는 방법에는 여러 가지가 있습니다. 문제를 정의하는 방법에 대한 선택은 사용 사례 또는 비즈니스 요구 사항에 따라 달라집니다.

각 제품에 대한 고객의 구매 건수를 예측하려고 합니까(이 경우 대상은 숫자이며 사용자는 회귀 문제를 해결하고 있음)? 또는 어떤 제품이 10개 이상 판매되는지 예측하려고 합니까(이 경우 대상은 이진수이고 사용자는 바이너리 분류 문제를 해결하고 있음)?

문제가 지나치게 복잡해지지 않게 하고 요구 사항에 맞는 가장 단순한 솔루션을 만드는 것이 중요합니다. 하지만 정보의 손실, 특히 과거 대답에 대한 정보의 손실을 방지하는 것도 중요합니다. 여기에서 이전의 실제 판매 수를 "10 이상" 또는 "10보다 적은" 이진 변수로 변환하면 중요한 정보가 손실됩니다. 예측하기에 가장 적절한 대상을 결정하는 데 시간을 투자하면 질문에 대답하지 못하는 모델을 빌드하지 않게 해줍니다.