Formats de données pris en charge - Amazon SageMaker

Formats de données pris en charge

Lorsque vous créez un fichier manifeste source pour un Types de tâches intégrées manuellement, vos données source doivent être dans l'un des formats de fichier pris en charge suivants pour le type de données source respectif. Pour en savoir plus sur la configuration automatisée des données, veuillez consulter Configuration automatique des données.

Astuce

Lorsque vous utilisez la configuration automatisée des données, des formats de données supplémentaires peuvent être utilisés pour générer un fichier manifeste source pour les types de tâches basées sur des trames vidéo ou du texte.

Types de tâche Type de données d'entrée Formats pris en charge Exemple de ligne de manifeste source

Zone de délimitation, segmentation sémantique, classification des images (étiquette unique et multiple), vérification et ajustement des étiquettes

Image

.jpg, .jpeg, .png

{"source-ref": "s3://DOC-EXAMPLE-BUCKET1/example-image.png"}

Reconnaissance des entités nommées, classification de texte (étiquette unique et multiple)

Texte Texte brut
{"source": "Lorem ipsum dolor sit amet"}

Classification des vidéos

Clips vidéo .mp4, .ogg et .webm
{"source-ref": "s3:///example-video.mp4"}
Détection d'objets de trame vidéo, suivi d'objets de trame vidéo (cadre de délimitation, polylignes, polygones ou point clé) Trames vidéo et fichiers de séquence de trames vidéo (pour le suivi d'objets)

Trames vidéo : .jpg, .jpeg, .png

Fichiers de séquence : .json

Reportez-vous à  Création d'un fichier manifeste source de trame vidéo.

Segmentation sémantique de nuage de points 3D, détection d'objets de nuage de points 3D, suivi d'objets de nuage de points 3D

Nuages de points et fichiers de séquence de nuages de points (pour le suivi d'objets)

Nuages de points : format de pack binaire et ASCII. Pour de plus amples informations, veuillez consulter Formats de données 3D brutes acceptés.

Fichiers de séquence : .json

Reportez-vous à  Création d'un fichier manifeste d'entrée pour une tâche d'étiquetage de nuage de points 3D.