2. 실험 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

2. 실험

실험에는 실험 로깅, 추적 및 지표가 포함됩니다. 이는 플랫폼, 소스 제어 및 개발 환경에서 메타데이터 통합을 실험하는 것으로 해석됩니다. 또한 실험에는 디버깅을 통해 모델 성능과 정확도를 최적화할 수 있는 기능도 포함됩니다.

2.1 통합 개발 환경

통합 개발 환경(IDE)은 클라우드와 직접 통합됩니다. IDE는와 상호 작용하고 더 큰 시스템에 명령을 제출할 수 있습니다. 이상적으로는 다음을 지원합니다.

  • 로컬 개발

  • 버전 관리 통합

  • 버전 제어로 전송되는 모든 로그 및 아티팩트를 사용하여 디버깅

2.2 코드 버전 관리

재현성과 재사용성을 보장하기 위해 모든 코드는 적절한 버전 관리를 통해 소스 리포지토리에 커밋됩니다. 여기에는 인프라 코드, 애플리케이션 코드, 모델 코드, 노트북(사용하기로 선택한 경우)도 포함됩니다.

2.3 추적

ML 프로젝트에는 기계 학습 실험을 추적하고 분석할 수 있는 도구가 필요합니다. 이 도구는 기계 학습 실험 실행 중에 모든 지표, 파라미터 및 아티팩트를 로깅하여 모든 메타데이터를 중앙 위치에 기록해야 합니다. 중앙 위치는 실행하는 모든 실험을 분석, 시각화 및 감사할 수 있는 기능을 제공합니다.

2.4 교차 플랫폼 통합

실험 및 모든 메타데이터에 대한 기록 결과는 시스템의 다른 부분에서 액세스할 수 있습니다. 예를 들어, 모니터링 도구와 마찬가지로 마련된 오케스트레이션 파이프라인이이 데이터에 액세스할 수 있습니다.

2.5 디버깅: 정확도 및 시스템 성능

다음에 대한 실행을 검사하기 위한 포괄적인 모델 디버깅 프레임워크가 마련되어 있습니다.

  • 병목 현상 찾기

  • 이상에 대한 알림

  • 리소스 사용률 극대화

  • 실험 분석 지원

훈련이 집약적인 경우 처리량을 극대화하는 기능이 중요하며 이를 비용 최적화에 필요한 도구로 삼습니다.