기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
온라인 사기 인사이트
온라인 Fraud Insights는 감독을 받는 기계 학습 모델로, 사기 및 합법적인 거래의 과거 예를 사용하여 모델을 교육합니다. 온라인 사기 인사이트 모델은 적은 기록 데이터를 기반으로 사기를 탐지할 수 있습니다. 모델의 입력은 유연하므로 가짜 리뷰, 프로모션 남용, 게스트 체크아웃 사기 등 다양한 사기 위험을 감지하도록 조정할 수 있습니다.
온라인 Fraud Insights 모델은 데이터 보강, 변환 및 사기 분류에 기계 학습 알고리즘 앙상블을 사용합니다. 모델 훈련 프로세스의 일환으로 Online Fraud Insights는 IP 주소 및 BIN 번호와 같은 원시 데이터 요소를 IP 주소의 지리적 위치 또는 신용 카드 발급 은행과 같은 타사 데이터로 보강합니다. 타사 데이터 외에도 Online Fraud Insights는 Amazon 및에서 관찰된 사기 패턴을 고려하는 딥 러닝 알고리즘을 사용합니다 AWS. 이러한 사기 패턴은 그라데이션 트리 부스팅 알고리즘을 사용하여 모델에 입력 기능이 됩니다.
성능을 높이기 위해 Online Fraud Insights는 베이지안 최적화 프로세스를 통해 그라데이션 트리 부스팅 알고리즘의 하이퍼 파라미터를 최적화합니다. 다양한 모델 파라미터(예: 나무 수, 나무 깊이, 잎당 샘플 수)를 사용하여 수십 개의 다양한 모델을 순차적으로 훈련합니다. 또한 소수 사기 집단을 업웨이트하는 등 다양한 최적화 전략을 사용하여 매우 낮은 사기율을 처리합니다.
데이터 소스 선택
온라인 Fraud Insights 모델을 훈련할 때 외부(Amazon Fraud Detector 외부)에 저장되거나 Amazon Fraud Detector 내에 저장된 이벤트 데이터에 대해 모델을 훈련하도록 선택할 수 있습니다. Amazon Fraud Detector가 현재 지원하는 외부 스토리지는 Amazon Simple Storage Service(Amazon S3)입니다. 가 외부 스토리지를 사용하는 경우 이벤트 데이터 세트를 쉼표로 구분된 값(CSV) 형식으로 Amazon S3 버킷에 업로드해야 합니다. 이러한 데이터 스토리지 옵션은 모델 훈련 구성 내에서 EXTERNAL_EVENTS(외부 스토리지의 경우) 및 INGESTED_EVENTS(내부 스토리지의 경우)라고 합니다. 사용 가능한 데이터 소스와 해당 소스에 데이터를 저장하는 방법에 대한 자세한 내용은 섹션을 참조하세요이벤트 데이터 스토리지.
데이터 준비
이벤트 데이터(Amazon S3 또는 Amazon Fraud Detector)를 저장하기로 선택한 위치에 관계없이 온라인 Fraud Insights 모델 유형에 대한 요구 사항은 동일합니다.
데이터 세트에는 열 헤더 EVENT_LABEL이 포함되어야 합니다. 이 변수는 이벤트를 사기 또는 합법적으로 분류합니다. CSV 파일(외부 스토리지)을 사용할 때는 파일의 각 이벤트에 EVENT_LABEL을 포함해야 합니다. 내부 스토리지의 경우 EVENT_LABEL 필드는 선택 사항이지만 모든 이벤트에 레이블을 지정하여 훈련 데이터 세트에 포함해야 합니다. 모델 훈련을 구성할 때 레이블이 지정되지 않은 이벤트를 무시할지, 레이블이 지정되지 않은 이벤트에 대해 합법적인 레이블을 맡을지, 레이블이 지정되지 않은 모든 이벤트에 대해 사기 레이블을 맡을지 선택할 수 있습니다.
데이터 선택
온라인 사기 인사이트 모델 훈련을 위한 데이터 선택에 대한 자세한 내용은 이벤트 데이터 수집을 참조하세요.
온라인 사기 인사이트 훈련은 EVENT_TIMESTAMP를 기반으로 과거 데이터를 샘플링하고 분할합니다. 데이터를 수동으로 샘플링할 필요가 없으며 그렇게 하면 모델 결과에 부정적인 영향을 미칠 수 있습니다.
이벤트 변수
Online Fraud Insights 모델에는 필요한 이벤트 메타데이터를 제외하고 모델 훈련을 위한 데이터 검증을 통과하고 모델당 최대 100개의 변수를 허용하는 최소 2개의 변수가 필요합니다. 일반적으로 변수를 많이 제공할수록 모델이 사기와 합법적인 이벤트를 더 잘 구별할 수 있습니다. 온라인 사기 인사이트 모델은 사용자 지정 변수를 포함한 수십 개의 변수를 지원할 수 있지만, 일반적으로 이러한 변수가 평가 중인 개체를 식별하는 데 가장 효과적이므로 IP 주소와 이메일 주소를 포함하는 것이 좋습니다.
데이터 검증
교육 프로세스의 일환으로 Online Fraud Insights는 데이터 세트에서 모델 교육에 영향을 미칠 수 있는 데이터 품질 문제를 검증합니다. 데이터를 검증한 후 Amazon Fraud Detector는 가능한 최상의 모델을 구축하기 위해 적절한 조치를 취합니다. 여기에는 잠재적 데이터 품질 문제에 대한 경고 실행, 데이터 품질 문제가 있는 변수 자동 제거 또는 오류 실행 및 모델 훈련 프로세스 중지가 포함됩니다. 자세한 내용은 데이터 세트 검증을 참조하세요.