권장 사항 결과 해석하기

개별 Inference Recommender 작업 결과에는 컨테이너의 지연 시간 및 처리량 개선을 위해 조정된 환경 변수 파라미터인 InstanceType, InitialInstanceCount, EnvironmentParameters이(가) 포함됩니다. 결과에는 MaxInvocations, ModelLatency, CostPerHour, CostPerInference, CpuUtilization, MemoryUtilization 같은 성능 및 비용 지표도 포함됩니다.

아래 표에 이 지표에 대한 설명이 있습니다. 이 지표로 검색 범위를 좁혀 사용 사례에 가장 적합한 엔드포인트 구성을 찾을 수 있습니다. 예를 들어, 처리량에 중점을 둔 전반적인 가격 대비 성능이 동기라면 CostPerInference에 집중해야 합니다.

지표	설명	사용 사례
`ModelLatency`	모델이 본 시점에서 응답하는 데 걸리는 시간 간격. SageMaker 이 간격에는 요청을 전송하고 모델의 컨테이너에서 응답을 가져오는 데 걸리는 로컬 통신 시간과 컨테이너에서 추론을 완료하는 데 걸리는 시간도 포함됩니다. 단위: 밀리초	광고 게재, 의료 진단 등 지연 시간에 민감한 워크로드
`MaximumInvocations`	1분 간 모델 엔드포인트로 전송된 최대 `InvokeEndpoint` 요청 수. 단위: 없음	비디오 처리, 일괄 추론 등 처리량 중심의 워크로드
`CostPerHour`	실시간 엔드포인트의 시간당 예상 비용. 단위: 미국 달러	지연 기한이 없는 비용에 민감한 워크로드
`CostPerInference`	실시간 엔드포인트의 추론 호출당 예상 비용. 단위: 미국 달러	처리량을 중심으로 전반적인 가격 대비 성능을 극대화합니다.
`CpuUtilization`	엔드포인트 인스턴스의 분당 최대 간접 호출 시 예상 CPU 사용률. 단위: 백분율	인스턴스의 코어 CPU 사용률을 파악하여 벤치마킹 중에 인스턴스 상태를 파악합니다.
`MemoryUtilization`	엔드포인트 인스턴스의 분당 최대 간접 호출 시 예상 메모리 사용률. 단위: 백분율	인스턴스의 코어 메모리 사용률을 파악하여 벤치마킹 중에 인스턴스 상태를 파악합니다.

경우에 따라 다음과 같은 CPUUtilization 다른 SageMaker 엔드포인트 호출 메트릭을 살펴봐야 할 수도 있습니다. 모든 Inference Recommender 작업 결과에는 부하 테스트 중에 구동된 엔드포인트의 이름이 포함됩니다. CloudWatch 를 사용하면 엔드포인트가 삭제된 후에도 해당 엔드포인트의 로그를 검토할 수 있습니다.

다음 이미지는 추천 결과에서 단일 엔드포인트에 대해 검토할 수 있는 CloudWatch 지표 및 차트의 예입니다. 이 권장 사항 결과는 기본 작업에서 도출된 것입니다. 권장 사항 결과의 스칼라 값을 해석하는 방법은 간접 호출 그래프가 처음으로 평준화되기 시작하는 시점을 기준으로 계산하는 것입니다. 예를 들어, 보고된 ModelLatency 값은 03:00:31 부근에서 정체기가 시작됩니다.

다음 CloudWatch 지표에 대한 차트: 호출,, CPU 사용률, ModelLatency OverheadLatency, 호출 4xX 오류 MemoryUtilization DiskUtilization, 호출 5XX 오류 및. InvocationsPerInstance

위 차트에 사용된 지표에 대한 전체 설명은 엔드포인트 호출 CloudWatch 지표를 참조하십시오. SageMaker

ClientInvocations, NumberOfUsers 등 Inference Recommender에서 게시한 성능 지표는 /aws/sagemaker/InferenceRecommendationsJobs 네임스페이스에서도 볼 수 있습니다. Inference Recommender에서 게시한 지표와 설명 전체 목록은 SageMaker 추론 추천자 작업 지표에서 확인하세요.

Python용 SDK AWS (Boto3) 를 사용하여 엔드포인트에 대한 CloudWatch 메트릭을 탐색하는 방법에 대한 예는 amazon-sagemaker-examplesGithub 리포지토리의 Amazon SageMaker 추론 추천자 - 메트릭 Jupyter 노트북을 참조하십시오. CloudWatch

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

Neo로 컴파일된 권장 사항 가져오기

오토 스케일링 정책 권장 사항 가져오기