모델 성능 디버깅 및 개선 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

모델 성능 디버깅 및 개선

기계 학습 모델, 딥 러닝 신경망, 변환기 모델 교육의 핵심은 안정적인 모델 융합을 달성하는 것입니다. 따라서 state-of-the-art 모델에는 수백만, 수십억 또는 수조 개의 모델 매개변수가 있습니다. 매번 반복할 때마다 엄청난 수의 모델 파라미터를 업데이트하는 작업의 수는 쉽게 천문학적으로 많아질 수 있습니다. 모델 수렴 문제를 파악하려면 최적화 프로세스 중에 계산된 모델 매개변수, 활성화 및 기울기에 액세스할 수 있어야 합니다.

SageMaker Amazon은 이러한 컨버전스 문제를 식별하고 모델에 대한 가시성을 확보하는 데 도움이 되는 두 가지 디버깅 도구를 제공합니다.

SageMaker 아마존과 TensorBoard

SageMaker교육 플랫폼 내의 오픈 소스 커뮤니티 도구와의 호환성을 높이려면 도메인에서 TensorBoard 애플리케이션으로 SageMaker 호스팅하십시오. SageMaker 교육 작업을 가져와서 TensorBoard 요약 작성기를 SageMaker 계속 사용하여 모델 출력 텐서를 수집할 수 있습니다. 도메인에 TensorBoard 구현되기 때문에 AWS 계정의 SageMaker 도메인에서 사용자 프로필을 관리할 수 있는 더 많은 옵션을 제공하고 특정 작업 및 리소스에 대한 액세스 권한을 부여하여 사용자 프로필을 세밀하게 제어할 수 있습니다. SageMaker 자세한 내용은 Amazon에서 교육 작업을 디버깅하고 분석하는 TensorBoard 데 사용합니다. SageMaker 를 참조하세요.

아마존 SageMaker 디버거

Amazon SageMaker Debugger는 콜백에 후크를 등록하여 모델 출력 텐서를 추출하고 Amazon 심플 스토리지 서비스에 저장하는 도구를 SageMaker 제공하는 기능입니다. 과적합, 포화 활성화 함수, 기울기 소실 등과 같은 모델 수렴 문제를 감지하기 위한 내장 규칙 제공합니다. 또한 Amazon CloudWatch Events를 사용하여 내장된 규칙을 설정하고 감지된 문제에 AWS Lambda 대해 자동화된 조치를 취하고 이메일 또는 문자 알림을 수신하도록 Amazon Simple Notification Service를 설정할 수 있습니다. 자세한 내용은 Amazon SageMaker 디버거를 사용하여 모델 성능을 디버깅하고 개선하십시오. 단원을 참조하십시오.