Résolution des problèmes - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Résolution des problèmes

Si vous rencontrez des erreurs dans Amazon SageMaker Batch Transform, reportez-vous aux conseils de résolution des problèmes suivants.

Erreurs de délai d'expiration max.

Si vous obtenez des erreurs de délai d'expiration max. lors de l'exécution de tâches de transformation par lots, essayez ce qui suit :

  • Commencez par l'enregistrement unique BatchStrategy, une taille de lot égale ou inférieure à la valeur par défaut (6 Mo) que vous spécifiez dans le paramètre MaxPayloadInMB, et un petit exemple de jeu de données. Réglez le paramètre de délai d'expiration maximal InvocationsTimeoutInSeconds (qui est d'une heure maximum) jusqu'à ce que vous receviez une réponse d'appel réussie.

  • Une fois que vous avez reçu une réponse d'appel réussie, augmentez la valeur MaxPayloadInMB (qui a une valeur maximale de 100 Mo) et les paramètres InvocationsTimeoutInSeconds pour déterminer la taille de lot maximale pouvant prendre en charge le délai d'expiration du modèle souhaité. Vous pouvez utiliser l'enregistrement unique ou multiple BatchStrategy à cette étape.

    Note

    Le dépassement de la limite MaxPayloadInMB provoque une erreur. Cette erreur peut se produire lorsqu'un jeu de données volumineux ne peut pas être fractionné, que le paramètre SplitType est défini sur none (aucun) ou que des enregistrements individuels dans le jeu de données dépassent la limite.

  • (Facultatif) Réglez le paramètre MaxConcurrentTransforms, qui spécifie le nombre maximal de demandes parallèles pouvant être envoyées à chaque instance dans une tâche de transformation par lots. Toutefois, la valeur de MaxConcurrentTransforms * MaxPayloadInMB ne doit pas dépasser 100 Mo.

Sortie incomplète

SageMaker utilise l'API de chargement partitionné Amazon S3 pour télécharger les résultats d'une tâche de transformation par lots vers Amazon S3. En cas d'erreur, les résultats téléchargés sont supprimés d'Amazon S3. Dans certains cas, par exemple une indisponibilité du réseau, un chargement partitionné incomplet peut être conservé dans Amazon S3. Un chargement incomplet peut également se produire si vous avez plusieurs fichiers d'entrée mais que certains ne peuvent pas être traités par SageMaker Batch Transform. Les fichiers d'entrée qui n'ont pas pu être traités n'auront pas de fichiers de sortie correspondants dans Amazon S3.

Pour éviter les frais de stockage, nous vous recommandons d'ajouter la stratégie de compartiment S3 aux règles de cycle de vie du compartiment S3. Cette stratégie supprime les chargements partitionnés incomplets qui pourraient être stockés dans le compartiment S3. Pour de plus amples informations, veuillez consulter Gestion du cycle de vie des objets.

La tâche s'affiche sous la forme failed

Si une tâche de transformation par lots ne parvient pas à traiter un fichier d'entrée en raison d'un problème avec le jeu de données, SageMaker vous avertit en marquant la tâche comme failed. Si un fichier d'entrée contient un enregistrement incorrect, la tâche de transformation ne crée pas de fichier de sortie pour ce fichier d'entrée, car cela l'empêche de conserver le même ordre dans les données transformées que dans le fichier d'entrée. Lorsque votre ensemble de données comporte plusieurs fichiers d'entrée, une tâche de transformation continue à traiter les fichiers d'entrée même si l'un de ces fichiers ne peut pas être traité. Les fichiers traités génèrent quand même des résultats exploitables.

Si vous utilisez vos propres algorithmes, vous pouvez utiliser un espace réservé au texte, par exemple ERROR, lorsque l'algorithme détecte un mauvais enregistrement dans un fichier d'entrée. Par exemple, si le dernier enregistrement d'un ensemble de données est mauvais, l'algorithme place le texte de l'espace réservé pour cet enregistrement dans le fichier de sortie.