문제 수립

기계 학습의 첫 번째 단계는 레이블 또는 대상 대답이라고 알려진 예측 대상을 결정하는 것입니다. 제품을 제조하려는 시나리오를 상상해 볼 때 각 제품을 제조하는 것에 대한 사용자의 결정은 잠재적인 판매량에 따라 달라집니다. 이 시나리오에서는 각 제품이 얼마나 많이 구매될 것인지 예측할 수 있습니다(판매 횟수 예측). 기계 학습을 사용하여 이 문제를 정의하는 방법에는 여러 가지가 있습니다. 문제를 정의하는 방법에 대한 선택은 사용 사례 또는 비즈니스 요구 사항에 따라 달라집니다.

각 제품에 대한 고객의 구매 건수를 예측하려고 합니까(이 경우 대상은 숫자이며 사용자는 회귀 문제를 해결하고 있음)? 또는 어떤 제품이 10개 이상 판매되는지 예측하려고 합니까(이 경우 대상은 이진수이고 사용자는 바이너리 분류 문제를 해결하고 있음)?

문제가 지나치게 복잡해지지 않게 하고 요구 사항에 맞는 가장 단순한 솔루션을 만드는 것이 중요합니다. 하지만 정보의 손실, 특히 과거 대답에 대한 정보의 손실을 방지하는 것도 중요합니다. 여기에서 이전의 실제 판매 수를 "10 이상" 또는 "10보다 적은" 이진 변수로 변환하면 중요한 정보가 손실됩니다. 예측하기에 가장 적절한 대상을 결정하는 데 시간을 투자하면 질문에 대답하지 못하는 모델을 빌드하지 않게 해줍니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

Machine Learning 애플리케이션 빌드

레이블이 지정된 데이터 수집