Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Crea una raccomandazione di inferenza a livello di codice utilizzando AWS SDK for Python (Boto3) o il AWS CLI o in modo interattivo utilizzando Studio Classic o la console AI. SageMaker Specificate un nome di lavoro per la raccomandazione di inferenza, un ARN del ruolo AWS IAM, una configurazione di input e un pacchetto di modelli ARN quando avete registrato il modello nel registro dei modelli, oppure il nome del modello e ContainerConfig
un dizionario da quando avete creato il modello nella sezione Prerequisiti.
Usa l'API CreateInferenceRecommendationsJob
per avviare un processo di raccomandazione di inferenza. Imposta il campo JobType
su 'Default'
per i processi di raccomandazione di inferenza. È inoltre necessario indicare quanto segue:
-
Il nome della risorsa Amazon (ARN) di un ruolo IAM che consente al suggeritore di inferenza di eseguire attività per tuo conto. Definiscilo per il campo
RoleArn
. -
Un ARN di pacchetti di modelli o il nome del modello. Il suggeritore di inferenza supporta un ARN di pacchetti di modelli o un nome di modello come input. Specifica una delle seguenti proprietà:
-
L'ARN del pacchetto di modelli con versioni che hai creato quando hai registrato il tuo modello nel registro dei modelli SageMaker AI. Definiscilo per
ModelPackageVersionArn
nel campoInputConfig
. -
il nome del modello che hai creato. Definiscilo per
ModelName
nel campoInputConfig
. Inoltre, fornisci il dizionarioContainerConfig
che include i campi obbligatori da fornire con il nome del modello. Definiscilo perContainerConfig
nel campoInputConfig
. InContainerConfig
, se lo desideri, puoi anche specificare il campoSupportedEndpointType
comeRealTime
oServerless
. Se si specifica questo campo, il suggeritore di inferenza restituisce raccomandazioni solo per quel tipo di endpoint. Se si specifica questo campo, il suggeritore di inferenza restituisce raccomandazioni per entrambi i tipi di endpoint.
-
-
un nome per il processo di raccomandazione del suggeritore di inferenza per il campo
JobName
. Il nome del lavoro di Inference Recommender deve essere univoco all'interno della AWS regione e all'interno del tuo account. AWS
Importa il AWS SDK for Python (Boto3) pacchetto e crea un oggetto client SageMaker AI utilizzando la classe client. Se hai rispettato le fasi nella sezione Prerequisiti, specifica solo uno degli elementi seguenti:
-
Opzione 1: se desideri creare un processo di raccomandazioni di inferenza con un ARN del pacchetto di modelli, archivia l'ARN del gruppo di pacchetti di modelli in una variabile denominata
model_package_arn
. -
Opzione 2: se desideri creare un progetto di raccomandazioni di inferenza con un nome di modello e
ContainerConfig
, memorizza il nome del modello in una variabile denominatamodel_name
e il dizionarioContainerConfig
in una variabile denominatacontainer_config
.
# Create a low-level SageMaker service client.
import boto3
aws_region = '<INSERT>'
sagemaker_client = boto3.client('sagemaker', region_name=aws_region)
# Provide only one of model package ARN or model name, not both.
# Provide your model package ARN that was created when you registered your
# model with Model Registry
model_package_arn = '<INSERT>'
## Uncomment if you would like to create an inference recommendations job with a
## model name instead of a model package ARN, and comment out model_package_arn above
## Provide your model name
# model_name = '<INSERT>'
## Provide your container config
# container_config = '<INSERT>'
# Provide a unique job name for SageMaker Inference Recommender job
job_name = '<INSERT>'
# Inference Recommender job type. Set to Default to get an initial recommendation
job_type = 'Default'
# Provide an IAM Role that gives SageMaker Inference Recommender permission to
# access AWS services
role_arn = 'arn:aws:iam::<account>:role/*'
sagemaker_client.create_inference_recommendations_job(
JobName = job_name,
JobType = job_type,
RoleArn = role_arn,
# Provide only one of model package ARN or model name, not both.
# If you would like to create an inference recommendations job with a model name,
# uncomment ModelName and ContainerConfig, and comment out ModelPackageVersionArn.
InputConfig = {
'ModelPackageVersionArn': model_package_arn
# 'ModelName': model_name,
# 'ContainerConfig': container_config
}
)
Consulta la Amazon SageMaker API Reference Guide per un elenco completo di argomenti opzionali e obbligatori a cui puoi passare CreateInferenceRecommendationsJob
.