데이터 캡처 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 캡처

엔드포인트로 들어오는 입력과 Amazon S3에 배포된 모델의 추론 출력을 기록하기 위해 데이터 캡처라는 특징을 활성화할 수 있습니다. 데이터 캡처는 일반적으로 훈련, 디버깅 및 모니터링에 사용할 수 있는 정보를 기록하는 데 사용됩니다. Amazon SageMaker Model Monitor는 캡처된 데이터를 자동으로 파싱하고 이 데이터의 측정치를 사용자가 모델에 대해 생성한 기준선과 비교합니다. 모델 모니터링에 대한 자세한 내용은 Amazon SageMaker 모델 모니터로 데이터 및 모델 품질을 모니터링합니다.섹션을 참조하세요.

AWS SDK for Python (Boto) 또는 SageMaker Python SDK를 사용하여 실시간 및 배치 모델 모니터링 모드 모두에 데이터 캡처를 구현할 수 있습니다. 실시간 엔드포인트의 경우, 엔드포인트를 생성할 때 데이터 캡처 구성을 지정해야 합니다. 실시간 엔드포인트의 지속적 특성 때문에 특정 시간에 데이터 캡처를 켜거나 끄거나 샘플링 빈도를 변경하는 추가 옵션을 구성할 수 있습니다. 추론 데이터를 암호화하도록 선택할 수도 있습니다.

배치 변환 작업의 경우 정기적이고 주기적인 배치 변환 작업에 대해 일정에 따른 모델 모니터링 또는 지속적인 모델 모니터링을 실행하기 위해 데이터 캡처를 활성화할 수 있습니다. 배치 변환 작업을 생성할 때 데이터 캡처 구성을 지정해야 합니다. 이 구성에서는 출력과 함께 암호화를 켜거나 추론 ID를 생성할 수 있으며, 이렇게 하면 캡처한 데이터를 Ground Truth 데이터와 일치시키는 데 도움이 됩니다.