Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erstellen Sie eine Inferenzempfehlung programmgesteuert mit dem AWS SDK for Python (Boto3) oder dem AWS CLI oder interaktiv mit Studio Classic oder der AI-Konsole. SageMaker Geben Sie im Abschnitt Voraussetzungen einen Jobnamen für Ihre Inferenzempfehlung, einen AWS IAM-Rollen-ARN, eine Eingabekonfiguration und entweder einen Modellpaket-ARN an, als Sie Ihr Modell bei der Modellregistrierung registriert haben, oder Ihren Modellnamen und ein ContainerConfig
Wörterbuch von der Erstellung Ihres Modells.
Verwenden Sie die CreateInferenceRecommendationsJob
-API, um einen Job mit Inferenzempfehlungen zu starten. Stellen Sie das JobType
Feld auf 'Default'
ehlungen ein. Darüber hinaus sind folgende Angaben zu machen:
-
Der Amazon-Ressourcenname (ARN) einer IAM-Rolle, die es Inference Recommender ermöglicht, Aufgaben in Ihrem Namen durchzuführen. Definieren Sie dies für das
RoleArn
Feld. -
Ein Modellpaket-ARN oder ein Modellname. Inference Recommender unterstützt entweder einen Modellpaket-ARN oder einen Modellnamen als Eingabe. Geben Sie eines der folgenden Elemente an:
-
Der ARN des versionierten Modellpakets, das Sie erstellt haben, als Sie Ihr Modell bei der SageMaker AI-Modellregistrierung registriert haben. Definieren Sie dies für
ModelPackageVersionArn
in demInputConfig
Feld. -
Den Namen des Modells, welches Sie erstellt haben. Definieren Sie dies für
ModelName
imInputConfig
Feld. Geben Sie außerdem dasContainerConfig
Wörterbuch an, das die erforderlichen Felder enthält, die mit dem Modellnamen versehen werden müssen. Definieren Sie dies fürContainerConfig
in demInputConfig
Feld. In demContainerConfig
können Sie dasSupportedEndpointType
Feld auch optional als entwederRealTime
oderServerless
angeben. Wenn Sie dieses Feld angeben, gibt Inference Recommender nur Empfehlungen für diesen Endpunkttyp zurück. Wenn Sie dieses Feld nicht angeben, gibt Inference Recommender Empfehlungen für beide Endpunkttypen zurück.
-
-
Ein Name für Ihren Inference Recommender-Empfehlungsjob für das
JobName
Feld. Der Inference Recommender-Jobname muss innerhalb der AWS Region und in Ihrem Konto eindeutig sein. AWS
Importieren Sie das AWS SDK for Python (Boto3) Paket und erstellen Sie mithilfe der Client-Klasse ein SageMaker AI-Client-Objekt. Wenn Sie die Schritte im Abschnitt Voraussetzungen befolgt haben, geben Sie nur eine der folgenden Optionen an:
-
Option 1: Wenn Sie einen Job mit Inferenzempfehlungen mit einem Modellpaket-ARN erstellen möchten, speichern Sie den ARN der Modellpaketgruppe in einer Variablen namens
model_package_arn
. -
Option 2: Wenn Sie einen Job mit Inferenzempfehlungen mit einem Modellnamen und
ContainerConfig
erstellen möchten, speichern Sie den Modellnamen in einer Variablen mit dem Namenmodel_name
und dasContainerConfig
Wörterbuch in einer Variablen mit dem Namencontainer_config
.
# Create a low-level SageMaker service client.
import boto3
aws_region = '<INSERT>'
sagemaker_client = boto3.client('sagemaker', region_name=aws_region)
# Provide only one of model package ARN or model name, not both.
# Provide your model package ARN that was created when you registered your
# model with Model Registry
model_package_arn = '<INSERT>'
## Uncomment if you would like to create an inference recommendations job with a
## model name instead of a model package ARN, and comment out model_package_arn above
## Provide your model name
# model_name = '<INSERT>'
## Provide your container config
# container_config = '<INSERT>'
# Provide a unique job name for SageMaker Inference Recommender job
job_name = '<INSERT>'
# Inference Recommender job type. Set to Default to get an initial recommendation
job_type = 'Default'
# Provide an IAM Role that gives SageMaker Inference Recommender permission to
# access AWS services
role_arn = 'arn:aws:iam::<account>:role/*'
sagemaker_client.create_inference_recommendations_job(
JobName = job_name,
JobType = job_type,
RoleArn = role_arn,
# Provide only one of model package ARN or model name, not both.
# If you would like to create an inference recommendations job with a model name,
# uncomment ModelName and ContainerConfig, and comment out ModelPackageVersionArn.
InputConfig = {
'ModelPackageVersionArn': model_package_arn
# 'ModelName': model_name,
# 'ContainerConfig': container_config
}
)
Eine vollständige Liste der optionalen und erforderlichen Argumente, an die Sie übergeben können, finden Sie im Amazon SageMaker API-Referenzhandbuch CreateInferenceRecommendationsJob
.