Amazon SageMaker Profiler - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon SageMaker Profiler

Amazon SageMaker Profiler는 현재 미리 보기 릴리스 중이며 지원되는 에서 무료로 사용할 수 있습니다 AWS 리전. 일반적으로 사용 가능한 Amazon SageMaker Profiler 버전(있는 경우)에는 미리 보기에서 제공되는 것과 다른 기능 및 요금이 포함될 수 있습니다.

Amazon SageMaker Profiler는 에서 AWS 딥 러닝 모델을 훈련 SageMaker 하는 동안 프로비저닝된 컴퓨팅 리소스에 대한 세부 정보를 제공하는 Amazon의 기능입니다 SageMaker. 또한 및 CPU GPU 사용량 프로파일링, 에서 커널 실행GPUs, 에서 커널 시작CPUs, 동기화 작업, CPUs 및 간의 메모리 작업GPUs, 커널 시작과 해당 실행 간의 지연 시간, 및 간의 데이터 전송에 중점을 둡니다CPUsGPUs. SageMaker 프로파일러는 프로파일 , 프로파일링된 이벤트에 대한 통계 요약, GPUs 및 간의 이벤트 시간 관계를 추적하고 이해하기 위한 훈련 작업의 타임라인을 시각화하는 사용자 인터페이스(UI)도 제공합니다CPUs.

참고

SageMaker Profiler는 PyTorch 및 를 지원 TensorFlow 하며 AWS 용 딥 러닝 컨테이너에서 사용할 수 있습니다 SageMaker. 자세한 내용은 지원되는 프레임워크 이미지 AWS 리전및 인스턴스 유형을 참조하십시오.

데이터 사이언티스트용

대규모 컴퓨팅 클러스터에서 딥 러닝 모델을 훈련할 때는 병목 현상, 커널 시작 지연 시간, 메모리 제한, 낮은 리소스 사용률 등의 컴퓨팅 최적화 문제가 발생하는 경우가 많습니다.

이러한 컴퓨팅 성능 문제를 식별하려면 컴퓨팅 리소스를 더 깊이 분석하여 지연 시간을 유발하는 커널과 병목 현상을 유발하는 작업을 이해해야 합니다. 데이터 사이언티스트는 SageMaker Profiler UI를 사용하여 훈련 작업의 세부 프로파일을 시각화하는 이점을 누릴 수 있습니다. UI는 요약 차트와 타임라인 인터페이스가 포함된 대시보드를 제공하여 컴퓨팅 리소스의 모든 이벤트를 추적할 수 있습니다. 데이터 과학자는 사용자 지정 주석을 추가하여 SageMaker Profiler Python 모듈을 사용하여 훈련 작업의 특정 부분을 추적할 수도 있습니다.

관리자용

SageMaker 콘솔 또는 SageMaker 도메인의 Profiler 랜딩 페이지를 통해 AWS 계정 또는 SageMaker 도메인의 관리자인 경우 Profiler 애플리케이션 사용자를 관리할 수 있습니다. 각 도메인 사용자는 부여된 권한을 부여받아 자신의 Profiler 애플리케이션에 액세스할 수 있습니다. SageMaker 도메인 관리자 및 도메인 사용자는 권한 수준을 고려하여 Profiler 애플리케이션을 생성하고 삭제할 수 있습니다.