기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon CloudWatch는 Amazon SageMaker AI 모델 훈련 작업 로그와 Amazon SageMaker Debugger 규칙 처리 작업 로그를 수집합니다. Amazon CloudWatch Events 및 로 Debugger를 구성 AWS Lambda 하여 Debugger 규칙 평가 상태에 따라 조치를 취합니다.
예제 노트북
Amazon CloudWatch 및 AWS Lambda를 사용하는 디버거의 내장 규칙에 대한 작업을 사용하여 훈련 작업을 중지하는 실험을 위해 준비된 다음 예제 노트북을 실행할 수 있습니다.
-
Amazon SageMaker Debugger - 규칙을 통한 CloudWatch Events에 대한 반응
이 예제 노트북은 그라데이션이 소실 문제가 있는 훈련 작업을 실행합니다. Debugger VanishingGradient 기본 제공 규칙은 SageMaker AI TensorFlow 예측기를 구성하는 동안 사용됩니다. 디버거 규칙이 문제를 감지하면 훈련 작업이 종료됩니다.
-
SageMaker 디버거 규칙을 사용하여 중단된 훈련 감지 및 동작 간접 호출
이 예제 노트북은 10분 동안 강제로 휴면 모드로 전환하는 코드 라인이 포함된 훈련 스크립트를 실행합니다. 디버거 StalledTrainingRule 내장 규칙은 문제를 간접 호출하고 훈련 작업을 중지합니다.