최적화된 모델의 성능 평가 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

최적화된 모델의 성능 평가

최적화 작업을 사용하여 최적화된 모델을 생성한 후 모델 성능 평가를 실행할 수 있습니다. 이 평가는 지연 시간, 처리량 및 가격에 대한 지표를 산출합니다. 이러한 지표를 사용하여 최적화된 모델이 사용 사례의 요구 사항을 충족하는지 또는 추가 최적화가 필요한지 확인합니다.

Studio를 사용해야만 성능 평가를 실행할 수 있습니다. 이 기능은 Amazon SageMaker API 또는 Python을 통해 제공되지 않습니다SDK.

시작하기 전 준비 사항

성능 평가를 생성하기 전에 먼저 추론 최적화 작업을 생성하여 모델을 최적화해야 합니다. Studio에서는 이러한 작업으로 생성한 모델만 평가할 수 있습니다.

성능 평가 생성

Studio에서 다음 단계를 완료하여 최적화된 모델에 대한 성능 평가를 생성합니다.

  1. Studio 탐색 메뉴의 작업 에서 추론 최적화 를 선택합니다.

  2. 평가하려는 최적화된 모델을 생성한 작업의 이름을 선택합니다.

  3. 작업 세부 정보 페이지에서 성능 평가를 선택합니다.

  4. 성능 평가 페이지에서 일부 JumpStart 모델은 계속 진행하기 전에 최종 사용자 라이선스 계약(EULA)에 서명해야 합니다. 요청된 경우 라이선스 계약 섹션의 라이선스 조건을 검토합니다. 사용 사례에 적합한 용어인 경우 동의함 확인란을 선택하고 사용 약관을 EULA읽습니다.

  5. 토큰화기 모델 선택 에서 기본값을 수락하거나 평가를 위한 토큰화기 역할을 할 특정 모델을 선택합니다.

  6. 입력 데이터 세트 에서 다음을 선택합니다.

    • 의 기본 샘플 데이터 세트를 사용합니다 SageMaker.

    • 자체 샘플 데이터 세트를 가리키URI는 S3를 제공합니다.

  7. 성능 결과에 URI 대한 S3 의 경우 평가 결과를 저장하려는 Amazon S3의 위치를 URI 가리키는 를 제공합니다.

  8. 평가를 선택합니다.

    Studio는 테이블에 평가 작업이 표시되는 성능 평가 페이지를 보여줍니다. 상태 열에는 평가 상태가 표시됩니다.

  9. 상태가 완료 이면 작업 이름을 선택하여 평가 결과를 확인합니다.

평가 세부 정보 페이지에는 지연 시간, 처리량 및 요금에 대한 성능 지표를 제공하는 테이블이 표시됩니다. 각 지표에 대한 자세한 내용은 섹션을 참조하세요추론 성능 평가에 대한 지표 참조.