GPU 최적화: 분류 또는 회귀 입력: 분류 또는 회귀 요청 형식 출력: 분류 또는 회귀 응답 형식

Object2Vec 추론을 위한 데이터 형식

다음 페이지에서는 Amazon SageMaker AI Object2Vec 모델에서 스코어링 추론을 가져오기 위한 입력 요청 및 출력 응답 형식을 설명합니다.

GPU 최적화: 분류 또는 회귀

GPU 메모리 희소성으로 인해 INFERENCE_PREFERRED_MODE 환경 변수를 지정하여 분류/회귀 또는 출력: 인코더 임베딩 추론 네트워크가 GPU에 로드되는지 여부를 최적화할 수 있습니다. 대부분의 추론이 분류 또는 회귀에 사용되는 경우 INFERENCE_PREFERRED_MODE=classification을 지정합니다. 다음은 4개의 p3.2xlarge 인스턴스를 사용하는 분류/회귀 추론에 최적화된 배치 변환의 예제입니다.


transformer = o2v.transformer(instance_count=4,
                              instance_type="ml.p2.xlarge",
                              max_concurrent_transforms=2,
                              max_payload=1,  # 1MB
                              strategy='MultiRecord',
                              env={'INFERENCE_PREFERRED_MODE': 'classification'},  # only useful with GPU
                              output_path=output_s3_path)

입력: 분류 또는 회귀 요청 형식

Content-type: application/json


{
  "instances" : [
    {"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]},
    {"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]},
    {"in0": [774, 14, 21, 206], "in1": [21, 366, 125]}
  ]
}

Content-type: application/jsonlines


{"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]}
{"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]}
{"in0": [774, 14, 21, 206], "in1": [21, 366, 125]}

분류 문제의 경우 점수 벡터의 길이는 num_classes에 해당합니다. 회귀 문제의 경이 이 길이는 1입니다.

출력: 분류 또는 회귀 응답 형식

적용: application/json


{
    "predictions": [
        {
            "scores": [
                0.6533935070037842,
                0.07582679390907288,
                0.2707797586917877
            ]
        },
        {
            "scores": [
                0.026291321963071823,
                0.6577019095420837,
                0.31600672006607056
            ]
        }
    ]
}

적용: application/jsonlines


{"scores":[0.195667684078216,0.395351558923721,0.408980727195739]}
{"scores":[0.251988261938095,0.258233487606048,0.489778339862823]}
{"scores":[0.280087798833847,0.368331134319305,0.351581096649169]}

분류 및 회귀 형식 모두 점수가 개별 레이블에 적용됩니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

훈련 형식

추론 형식: 임베딩