Fonctionnalités Paramètres Affinement Sortie Détection de filigranes Directives d’ingénierie de requête

Titan Image Generator G1Modèle Amazon

Amazon Titan Image Generator G1 est un modèle de génération d'images. Il génère des images à partir de texte et permet aux utilisateurs de charger et de modifier une image existante. Ce modèle peut générer des images à partir de texte en langage naturel et peut également être utilisé pour modifier ou générer des variations pour une image existante ou générée. Les utilisateurs peuvent modifier une image à l’aide d’une invite de texte (sans masque) ou des parties d’une image à l’aide d’un masque d’image. Vous pouvez étendre les limites d’une image grâce à la fonctionnalité d’outpainting et remplir une image grâce à la fonctionnalité d’inpainting. Ce modèle peut également générer des variations d’une image en fonction d’une invite de texte facultative.

Titan Image Generator G1Le modèle Amazon prend en charge la personnalisation instantanée qui permet aux créateurs d'importer de 1 à 5 images de référence et de générer une image de sujet donnée dans un nouveau contexte. Le modèle préserve les principales caractéristiques des images, effectue un transfert de style basé sur l'image sans ingénierie rapide et produit un mélange de styles à partir de plusieurs images de référence, le tout sans réglage précis.

Pour continuer à soutenir les meilleures pratiques en matière d'utilisation responsable de l'IA, les modèles de la Titan Foundation sont conçus pour détecter et supprimer le contenu préjudiciable des données, rejeter le contenu inapproprié des entrées utilisateur et filtrer les résultats des modèles contenant du contenu inapproprié (tel que les discours de haine, les blasphèmes et la violence). Le Titan Image Generator FM ajoute un filigrane invisible à toutes les images générées.

Vous pouvez utiliser la fonction de détection des filigranes de la console Amazon Bedrock (aperçu) ou appeler l'API de détection des filigranes Amazon Bedrock (aperçu) pour vérifier si une image contient un filigrane provenant de Titan Image Generator.

Pour plus d'informations sur les directives d'Amazon Titan Image Generator G1 Prompt Engineering, consultez Amazon Titan Image Generator G1 Prompt Engineering Best Practices.

ID du modèle : amazon.titan-image-generator-v1
Nombre maximum de caractères d'entrée : 512 caractères
Taille maximale de l'image d'entrée : 5 Mo (seules certaines résolutions spécifiques sont prises en charge)
Taille maximale de l'image en utilisant la peinture en intérieur/extérieur — 1 408 x 1 408 px
Taille maximale de l’image en utilisant la variation d’image : 4 096 x 4 096 px
Langues : anglais
Type de sortie : image
Types d’images pris en charge : JPEG, JPG, PNG
Types d’inférence : débit provisionné, à la demande
Cas d’utilisation pris en charge : génération d’images, retouche d’images, variations d’images

Fonctionnalités

Génération T ext-to-image (T2I) — Entrez une invite de texte et générez une nouvelle image en sortie. L’image générée capture les concepts décrits par l’invite de texte.
Affinement d’un modèle T2I : importez plusieurs images pour capturer votre propre style et vos personnalisations, puis affinez le modèle T2I de base. Le modèle affiné génère des images qui respectent le style et les personnalisations d’un utilisateur spécifique.
Options de retouche d’image : incluent l’inpainting, l’outpainting, la génération de variations et la retouche automatique sans masque d’image.
Inpainting : utilise une image et un masque de segmentation comme données d’entrée (provenant de l’utilisateur ou estimées par le modèle) et reconstruit la région dans le masque. Utilisez l’inpainting pour supprimer les éléments masqués et les remplacer par des pixels d’arrière-plan.
Outpainting : utilise une image et un masque de segmentation comme données d’entrée (provenant de l’utilisateur ou estimées par le modèle) et génère de nouveaux pixels qui étendent la région en toute transparence. Utilisez un outpainting précis pour préserver les pixels de l’image masquée lorsque vous étendez l’image jusqu’aux limites. Utilisez l’outpainting par défaut pour étendre les pixels de l’image masquée jusqu’aux limites de l’image en fonction des paramètres de segmentation.
Variation d'image — Utilise 1 à 5 images et une invite facultative comme entrée. Il génère une nouvelle image qui préserve le contenu des images d'entrée, mais en modifie le style et l'arrière-plan.

Note

si vous utilisez un modèle affiné, vous ne pouvez pas utiliser les fonctionnalités d'inpainting ou de surpeinture de l'API ou du modèle.

Paramètres

Pour plus d'informations sur les paramètres Titan Image Generator G1 d'inférence Amazon, consultez la section Paramètres d'Titan Image Generator G1inférence Amazon.

Affinement

Pour plus d'informations sur la mise au point du Titan Image Generator G1 modèle Amazon, consultez les pages suivantes.

Titan Image Generator G1réglage précis et tarification

Le modèle utilise l'exemple de formule suivant pour calculer le prix total par tâche :

Prix total = étapes * Taille du batch * Prix par image vue

Valeurs minimales (auto) :

Nombre minimum d'étapes (auto) : 500
Taille de lot minimale : 8
Taux d'apprentissage par défaut - 0,00001
Prix par image vue - 0,005

Réglage précis des paramètres des hyperparamètres

Étapes : nombre de fois que le modèle est exposé à chaque lot. Aucun nombre de pas n'est défini par défaut. Vous devez sélectionner un nombre compris entre 10 et 40 000 ou une valeur de chaîne « Auto ».

Réglages des étapes - Auto — Amazon Bedrock détermine une valeur raisonnable en fonction des informations d'entraînement. Sélectionnez cette option pour donner la priorité aux performances du modèle par rapport aux coûts de formation. Le nombre d'étapes est déterminé automatiquement. Ce nombre sera généralement compris entre 1 000 et 8 000 selon votre ensemble de données. Les coûts des jobs sont influencés par le nombre d'étapes utilisées pour exposer le modèle aux données. Reportez-vous à la section des exemples de tarification des détails des prix pour comprendre comment le coût du travail est calculé. (Voir le tableau d'exemple ci-dessus pour voir comment le nombre de pas est lié au nombre d'images lorsque Auto est sélectionné.)

Paramètres des étapes - Personnalisé — Vous pouvez saisir le nombre d'étapes que vous souhaitez que Bedrock expose votre modèle personnalisé aux données d'entraînement. Cette valeur peut être comprise entre 10 et 40 000. Vous pouvez réduire le coût par image produite par le modèle en utilisant une valeur de nombre d'étapes inférieure.

Taille du lot : nombre d'échantillons traités avant la mise à jour des paramètres du modèle. Cette valeur est comprise entre 8 et 192 et est un multiple de 8.

Taux d'apprentissage : taux auquel les paramètres du modèle sont mis à jour après chaque lot de données d'entraînement. Il s'agit d'une valeur flottante comprise entre 0 et 1. Le taux d'apprentissage est défini sur 0,00001 par défaut.

Pour plus d'informations sur la procédure de réglage précis, voir Soumettre une tâche de personnalisation du modèle.

Sortie

Titan Image Generator G1utilise la taille et la qualité de l'image de sortie pour déterminer le prix d'une image. Titan Image Generator G1propose deux segments de prix basés sur la taille : un pour 512 x 512 images et un autre pour 1 024 x 1024 images. Le prix dépend de la taille de l’image (hauteur x largeur), inférieure ou égale à 512 x 512 ou supérieure à 512 x 512.

Pour plus d'informations sur les tarifs d'Amazon Bedrock, consultez les tarifs d'Amazon Bedrock.

Détection de filigranes

Note

La détection des filigranes pour la console et l'API Amazon Bedrock est disponible dans la version préliminaire publique et ne détecte qu'un filigrane généré à partir de. Titan Image Generator G1 Cette fonctionnalité n'est actuellement disponible que dans les us-east-1 régions us-west-2 et. La détection du filigrane est une détection très précise du filigrane généré par. Titan Image Generator G1 Les images modifiées par rapport à l'image d'origine peuvent produire des résultats de détection moins précis.

Ce modèle ajoute un filigrane invisible à toutes les images générées afin de réduire la diffusion de fausses informations, de contribuer à la protection des droits d'auteur et de suivre l'utilisation du contenu. Une détection de filigrane est disponible pour vous aider à confirmer si une image a été générée par le Titan Image Generator G1 modèle, qui vérifie l'existence de ce filigrane.

Note

L'API Watermark Detection est en version préliminaire et est sujette à modification. Nous vous recommandons de créer un environnement virtuel pour utiliser le SDK. Les API de détection de filigranes n'étant pas disponibles dans les derniers SDK, nous vous recommandons de désinstaller la dernière version du SDK de l'environnement virtuel avant d'installer la version avec les API de détection de filigranes.

Vous pouvez télécharger votre image pour détecter si un filigrane de Titan Image Generator G1 est présent sur l'image. Utilisez la console pour détecter un filigrane provenant de ce modèle en suivant les étapes ci-dessous.

Pour détecter un filigrane avec Titan Image Generator G1 :

Ouvrez la console Amazon Bedrock.
Sélectionnez Vue d'ensemble dans le volet de navigation d'Amazon Bedrock. Choisissez l'onglet Construire et tester.
Dans la section Sauvegardes, accédez à Détection des filigranes et choisissez Afficher la détection des filigranes.
Sélectionnez Charger une image et recherchez un fichier au format JPG ou PNG. La taille de fichier maximale autorisée est de 5 Mo.
Une fois chargée, une miniature de l'image s'affiche avec le nom, la taille du fichier et la date de dernière modification. Sélectionnez X pour supprimer ou remplacer l'image dans la section Télécharger.
Sélectionnez Analyser pour commencer l'analyse de détection des filigranes.
L'image est prévisualisée sous Résultats et indique si un filigrane est détecté avec un filigrane détecté sous l'image et une bannière sur l'image. Si aucun filigrane n'est détecté, le texte sous l'image indiquera Filigrane NON détecté.
Pour charger l'image suivante, sélectionnez X dans la miniature de l'image dans la section Télécharger et choisissez une nouvelle image à analyser.

Directives d’ingénierie de requête

Invite de masque : cet algorithme classe les pixels en concepts. L’utilisateur peut fournir une invite de texte qui sera utilisée pour classer les zones de l’image à masquer, en fonction de l’interprétation de l’invite de masque. L’option d’invite permet d’interpréter des invites plus complexes et de coder le masque dans l’algorithme de segmentation.

Masque d’image : vous pouvez également utiliser un masque d’image pour définir les valeurs du masque. Le masque d’image peut être combiné à une saisie d’invite de masque afin d’améliorer la précision. Le fichier de masque d’image doit être conforme aux paramètres suivants :

Les valeurs de l’image de masque doivent être 0 (noir) ou 255 (blanc). La zone du masque d’image ayant la valeur 0 sera regénérée avec l’image provenant de l’invite utilisateur et/ou de l’image d’entrée.
Le champ maskImage doit être une chaîne d’image codée en base64.
L’image de masque doit avoir les mêmes dimensions que l’image d’entrée (même hauteur et même largeur).
Seuls des fichiers PNG ou JPG peuvent être utilisés pour l’image d’entrée et l’image de masque.
L’image de masque ne doit utiliser que des valeurs de pixels en noir et blanc.
L’image de masque ne peut utiliser que les canaux RVB (le canal alpha n’est pas pris en charge).

Pour plus d'informations sur Amazon Titan Image Generator G1 Prompt Engineering, consultez Amazon Titan Image Generator G1 Prompt Engineering Best Practices.

Pour les directives générales d’ingénierie de requête, consultez Directives d’ingénierie de requête.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Amazon Titan Multimodal Embeddings G1

Studio Amazon Bedrock