특성 변환의 중요성 - Amazon Machine Learning

더 이상 Amazon Machine Learning 서비스를 업데이트하거나 새 사용자를 받지 않습니다. 이 설명서는 기존 사용자에 제공되지만 더 이상 업데이트되지 않습니다. 자세한 내용은 Amazon Machine Learning이란? 단원을 참조하세요.

특성 변환의 중요성

신용 카드 거래가 사기인지 아닌 지를 결정하는 역할을 하는 기계 학습 모델을 생각해 보세요. 애플리케이션 배경 지식과 데이터 분석을 바탕으로 입력 데이터에 포함시켜야 할 중요한 데이터 필드(또는 특성)를 결정할 수 있습니다. 예를 들어 거래 금액, 판매자 이름, 주소, 신용 카드 소유자 주소 등을 학습 프로세스에 제공하는 것이 중요합니다. 반면, 임의로 생성된 거래 ID는 정보를 담고 있지 않으며 (실제로 무작위임을 알고 있는 경우) 유용하지 않습니다.

어떤 필드를 포함시킬지 결정했으면 이들 특성을 학습 프로세스에 도움이 되도록 변환합니다. 변환은 입력 데이터에 배경 경험을 추가하여 기계 학습 모델이 이러한 경험을 활용할 수 있도록 합니다. 예를 들어 다음과 같은 판매자 주소는 문자열로 표시됩니다.

"123 Main Street, Seattle, WA 98101"

주소 자체로는 표현력이 제한적이므로 정확한 주소와 관련된 패턴을 학습하는 데만 유용합니다. 그러나 주소를 구성 요소로 나누면 "주소"(123 Main Street), "도시"(Seattle), "주"(WA) 및 "우편번호"(98101)와 같은 추가 특성을 생성할 수 있습니다. 이제 학습 알고리즘을 통해 서로 다른 거래를 그룹화하여 더 광범위한 패턴을 발견할 수 있습니다. 아마도 일부 판매자의 우편번호는 다른 판매자에 비해 사기 행위가 더 심할 수 있습니다.

특성 변환 접근 방식 및 프로세스에 대한 자세한 내용은 기계 학습 개념 단원을 참조하세요.