Optimisation du GPU : classification ou régression Entrée : format de demande de classification ou de régression Sortie : format de réponse de classification ou de régression

Format de données pour l'inférence d'Object2Vec

La page suivante décrit les formats de demande d'entrée et de réponse de sortie permettant d'obtenir une inférence de notation à partir du modèle Amazon SageMaker AI Object2Vec.

Optimisation du GPU : classification ou régression

La mémoire GPU étant faible, la variable d'environnement INFERENCE_PREFERRED_MODE peut être spécifiée pour déterminer si la classification/régression ou le réseau d'inférence Sortie : intégrations de l'encodeur doit être chargé dans le GPU. Si la majeure partie de votre inférence est destinée à la classification ou la régression, spécifiez INFERENCE_PREFERRED_MODE=classification. Voici un exemple Batch Transform d'utilisation de 4 instances p3.2xlarge optimisé pour l'inférence de classification/régression :


transformer = o2v.transformer(instance_count=4,
                              instance_type="ml.p2.xlarge",
                              max_concurrent_transforms=2,
                              max_payload=1,  # 1MB
                              strategy='MultiRecord',
                              env={'INFERENCE_PREFERRED_MODE': 'classification'},  # only useful with GPU
                              output_path=output_s3_path)

Entrée : format de demande de classification ou de régression

Content-type : application/json


{
  "instances" : [
    {"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]},
    {"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]},
    {"in0": [774, 14, 21, 206], "in1": [21, 366, 125]}
  ]
}

Type de contenu : application/jsonlines


{"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]}
{"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]}
{"in0": [774, 14, 21, 206], "in1": [21, 366, 125]}

Pour les problèmes de classification, la longueur du vecteur des scores correspond à num_classes. Pour les problèmes de régression, la longueur est égale à 1.

Sortie : format de réponse de classification ou de régression

ACCEPT : application/json.


{
    "predictions": [
        {
            "scores": [
                0.6533935070037842,
                0.07582679390907288,
                0.2707797586917877
            ]
        },
        {
            "scores": [
                0.026291321963071823,
                0.6577019095420837,
                0.31600672006607056
            ]
        }
    ]
}

ACCEPT: application/jsonlines.


{"scores":[0.195667684078216,0.395351558923721,0.408980727195739]}
{"scores":[0.251988261938095,0.258233487606048,0.489778339862823]}
{"scores":[0.280087798833847,0.368331134319305,0.351581096649169]}

Dans les formats de régression et de classification, les scores s'appliquent à chaque étiquette.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Formats d'entraînement

Formats d'inférence : intégrations