Création d’une tâche d’inférence par lots

Après avoir configuré un compartiment Amazon S3 avec des fichiers pour exécuter l'inférence de modèles, vous pouvez créer une tâche d'inférence par lots. Pour savoir comment créer une tâche d'inférence par lots, sélectionnez l'onglet correspondant à la méthode de votre choix et suivez les étapes.

Console

Pour créer une tâche d'inférence par lots

Connectez-vous au AWS Management Console en utilisant un IAMrôle avec des autorisations Amazon Bedrock, et ouvrez la console Amazon Bedrock à l'adresse. https://console.aws.amazon.com/bedrock/
Dans le volet de navigation de gauche, sélectionnez Batch inference.
Dans la section Tâches d'inférence par lots, choisissez Create job.
Dans la section Détails de la tâche, attribuez un nom à la tâche d'inférence par lots et sélectionnez le modèle à utiliser pour la tâche d'inférence par lots en choisissant Select model.
Dans la section Données d'entrée, choisissez Browse S3 et sélectionnez l'emplacement S3 contenant les fichiers pour votre tâche d'inférence par lots. Vérifiez que les fichiers sont conformes au format décrit dansMise en forme et chargement des données d’inférence.
Dans la section Données de sortie, choisissez Browse S3 et sélectionnez un emplacement S3 pour stocker les fichiers de sortie de votre tâche d'inférence par lots. Par défaut, les données de sortie seront cryptées par un Clé gérée par AWS. Pour choisir une KMS clé personnalisée, sélectionnez Personnaliser les paramètres de chiffrement (avancés) et choisissez une clé. Pour plus d'informations sur le chiffrement des données Amazon Bedrock et la configuration d'une KMS clé personnalisée, consultezChiffrement des données.
Dans la section Accès au service, sélectionnez l'une des options suivantes :
- Utiliser une fonction du service existante : sélectionnez une fonction du service dans la liste déroulante. Pour plus d’informations sur la configuration d’un rôle personnalisé avec les autorisations appropriées, consultez Autorisations requises pour l'inférence par lots.
- Créer et utiliser une nouvelle fonction du service : entrez un nom pour la fonction du service.
(Facultatif) Pour associer des balises à la tâche d'inférence par lots, développez la section Tags et ajoutez une clé et une valeur facultative pour chaque balise. Pour de plus amples informations, veuillez consulter Gérer les ressources à l'aide de balises.
Choisissez Create batch inference job (Créer une tâche d'inférence par lots).

API

Pour créer une tâche d'inférence par lots, envoyez une CreateModelInvocationJobdemande (voir le lien pour les formats de demande et de réponse et les détails des champs) avec un point de terminaison du plan de contrôle Amazon Bedrock.

Les champs suivants sont obligatoires :

Champ	Cas d’utilisation
jobName	Pour spécifier le nom de la tâche.
roleArn	Pour spécifier le nom de ressource Amazon (ARN) du rôle de service avec les autorisations nécessaires à la création et à la gestion de la tâche. Pour de plus amples informations, veuillez consulter Création d'un rôle de service pour l'inférence par lots.
modelId	Pour spécifier l'ID ou ARN le modèle à utiliser dans l'inférence.
inputDataConfig	Pour spécifier l'emplacement S3 contenant les instructions et les configurations à soumettre à la tâche. Pour de plus amples informations, veuillez consulter Mise en forme et chargement des données d’inférence.
outputDataConfig	Pour spécifier l'emplacement S3 dans lequel écrire les réponses du modèle.

Les champs suivants sont facultatifs :

Champ	Cas d’utilisation
timeoutDurationInHeures	Pour spécifier la durée en heures au bout de laquelle le travail arrivera à expiration.
balises	Pour spécifier les balises à associer à la tâche. Pour de plus amples informations, veuillez consulter Gérer les ressources à l'aide de balises.
clientRequestToken	Identifiant garantissant que la API demande ne sera traitée qu'une seule fois.

La réponse renvoie un jobArn que vous pouvez utiliser pour faire référence à la tâche lorsque vous effectuez d'autres appels liés à l'inférence API par lots.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Configuration des données

Afficher des informations sur les tâches d'inférence par lots