Titan Image Generator G1Amazon-Modell - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Titan Image Generator G1Amazon-Modell

Amazon Titan Image Generator G1 ist ein Modell zur Bilderzeugung. Es generiert Bilder aus Text und ermöglicht es Benutzern, ein vorhandenes Bild hochzuladen und zu bearbeiten. Dieses Modell kann Bilder aus Text in natürlicher Sprache generieren und kann auch verwendet werden, um Variationen für ein vorhandenes oder ein generiertes Bild zu bearbeiten oder zu generieren. Benutzer können ein Bild mit einer Textaufforderung (ohne Maske) oder Teile eines Bildes mit einer Bildmaske bearbeiten. Sie können die Ränder eines Bilds durch Übermalen erweitern und ein Bild mit Inpainting ausfüllen. Es kann auch Variationen eines Bildes basierend auf einer optionalen Textaufforderung generieren.

Titan Image Generator G1Das Amazon-Modell unterstützt sofortige Anpassungen, sodass Ersteller 1 bis 5 Referenzbilder importieren und ein bestimmtes Motivbild in einem neuen Kontext generieren können. Das Modell behält die wichtigsten Eigenschaften der Bilder bei, führt eine bildbasierte Stilübertragung ohne aufwändige technische Bearbeitung durch und erzeugt eine Stilmischung aus mehreren Referenzbildern, alles ohne Feinabstimmung.

Um weiterhin bewährte Verfahren für den verantwortungsvollen Umgang mit KI zu unterstützen, sind Titan Foundation-Modelle darauf ausgelegt, schädliche Inhalte in den Daten zu erkennen und zu entfernen, unangemessene Inhalte in der Benutzereingabe abzulehnen und die Ergebnisse der Modelle zu filtern, die unangemessene Inhalte enthalten (wie Hassreden, Obszönitäten und Gewalt). Der Titan Image Generator FM fügt allen generierten Bildern ein unsichtbares Wasserzeichen hinzu.

Sie können die Wasserzeichenerkennungsfunktion in der Amazon Bedrock-Konsole (Vorschau) verwenden oder die Amazon Bedrock Watermark Detection API (Vorschau) aufrufen, um zu überprüfen, ob ein Bild Wasserzeichen von Titan Image Generator enthält.

Weitere Informationen zu den Richtlinien von Amazon Titan Image Generator G1 Prompt Engineering finden Sie unter Amazon Titan Image Generator G1 Prompt Engineering Best Practices.

  • Model ID: amazon.titan-image-generator-v1

  • Max. Eingabezeichen: 512 Zeichen

  • Max. Eingabebildgröße — 5 MB (nur einige spezifische Auflösungen werden unterstützt)

  • Max. Bildgröße bei In-/Outpainting — 1.408 x 1.408 px

  • Maximale Bildgröße bei Verwendung der Bildvariation: 4.096 x 4.096 px

  • Sprachen: Englisch

  • Ausgabetyp: Bild

  • Unterstützte Bildtypen: JPEG, JPG, PNG

  • Inferenztypen: Auf Abruf bereitgestellter Durchsatz

  • Unterstützte Anwendungsfälle: Bilderzeugung, Bildbearbeitung, Bildvariationen

Features

  • T ext-to-image (T2I) -Generierung — Geben Sie eine Texteingabeaufforderung ein und generieren Sie ein neues Bild als Ausgabe. Das generierte Bild erfasst die in der Textaufforderung beschriebenen Konzepte.

  • Feinabstimmung eines T2I-Modells: Importieren Sie mehrere Bilder, um Ihren eigenen persönlichen Stil zu erfassen, und optimieren Sie dann das T2I-Kernmodell. Das fein abgestimmte Modell generiert Bilder, die dem Stil und der Anpassung der Benutzer entsprechen.

  • Bildbearbeitungsoptionen: Dazu gehören Inpainting, Outpainting, Generierung von Variationen und automatische Bearbeitung ohne Bildmaske.

  • Inpainting: Verwendet ein Bild und eine Segmentierungsmaske als Eingabe (entweder vom/von der Benutzer:in oder vom Modell geschätzt) und rekonstruiert den Bereich innerhalb der Maske. Verwenden Sie Inpainting, um maskierte Elemente zu entfernen und sie durch Hintergrundpixel zu ersetzen.

  • Outpainting: Verwendet ein Bild und eine Segmentierungsmaske als Eingabe (entweder vom/von der Benutzer:in oder vom Modell geschätzt) und generiert neue Pixel, die den Bereich nahtlos erweitern. Erhalten Sie die Pixel des maskierten Bilds mit präzisem Outpainting, wenn das Bild über seine Ränder erweitert wird. Verwenden Sie das Standard-Outpainting, um die Pixel des maskierten Bilds auf der Grundlage der Segmentierungseinstellungen bis zu den Bildrändern zu erweitern.

  • Bildvariation — Verwendet 1 bis 5 Bilder und eine optionale Eingabeaufforderung als Eingabe. Es generiert ein neues Bild, das den Inhalt der Eingabebilder beibehält, aber dessen Stil und Hintergrund variiert.

Anmerkung

Wenn Sie ein fein abgestimmtes Modell verwenden, können Sie keine In-Painting- oder Outpainting-Funktionen der API oder des Modells verwenden.

Parameter

Informationen zu Titan Image Generator G1 Amazon-Inferenzparametern finden Sie unter Titan Image Generator G1Amazon-Inferenzparameter.

Feinabstimmung

Weitere Informationen zur Feinabstimmung des Titan Image Generator G1 Amazon-Modells finden Sie auf den folgenden Seiten.

Titan Image Generator G1Feinabstimmung und Preisgestaltung

Das Modell verwendet die folgende Beispielformel, um den Gesamtpreis pro Auftrag zu berechnen:

Gesamtpreis = Schritte * Batchgröße * Preis pro betrachtetem Bild

Mindestwerte (auto):

  • Minimale Schritte (auto): 500

  • Minimale Chargengröße: 8

  • Die Standard-Lernrate beträgt 0,00001

  • Preis pro betrachtetem Bild - 0.005

Feinabstimmung der Hyperparameter-Einstellungen

Schritte — Gibt an, wie oft das Modell jeder Charge ausgesetzt ist. Es gibt keine Standardeinstellung für die Schrittanzahl. Sie müssen eine Zahl zwischen 10 und 40.000 oder den Zeichenkettenwert „Auto“ auswählen.

Schritteinstellungen — Automatisch — Amazon Bedrock ermittelt anhand von Trainingsinformationen einen angemessenen Wert. Wählen Sie diese Option, um der Modellleistung Vorrang vor den Schulungskosten einzuräumen. Die Anzahl der Schritte wird automatisch bestimmt. Diese Zahl liegt in der Regel zwischen 1.000 und 8.000, basierend auf Ihrem Datensatz. Die Auftragskosten werden durch die Anzahl der Schritte beeinflusst, die verwendet werden, um das Modell den Daten zugänglich zu machen. Weitere Informationen zur Berechnung der Auftragskosten finden Sie im Abschnitt mit Preisbeispielen in den Preisdetails. (In der obigen Beispieltabelle können Sie sehen, wie die Anzahl der Schritte mit der Anzahl der Bilder zusammenhängt, wenn Automatisch ausgewählt ist.)

Schritteinstellungen — Benutzerdefiniert — Sie können die Anzahl der Schritte eingeben, mit der Bedrock Ihr benutzerdefiniertes Modell den Trainingsdaten zugänglich machen soll. Dieser Wert kann zwischen 10 und 40.000 liegen. Sie können die Kosten pro vom Modell erzeugtem Bild reduzieren, indem Sie einen niedrigeren Wert für die Anzahl der Schritte verwenden.

Chargengröße — Die Anzahl der Proben, die verarbeitet wurden, bevor die Modellparameter aktualisiert werden. Dieser Wert liegt zwischen 8 und 192 und ist ein Vielfaches von 8.

Lernrate — Die Geschwindigkeit, mit der die Modellparameter nach jedem Stapel von Trainingsdaten aktualisiert werden. Dies ist ein Gleitkommawert zwischen 0 und 1. Die Lernrate ist standardmäßig auf 0,00001 festgelegt.

Weitere Informationen zum Verfahren zur Feinabstimmung finden Sie unter Einen Modellanpassungsauftrag einreichen.

Output

Titan Image Generator G1verwendet die Größe und Qualität des Ausgabebilds, um den Preis für ein Bild zu bestimmen. Titan Image Generator G1hat je nach Größe zwei Preissegmente: eines für 512*512 Bilder und eines für 1024*1024 Bilder. Die Preisgestaltung basiert auf der Bildgröße (Höhe*Breite), die mindestens 512*512 entspricht oder größer als 512*512 ist.

Weitere Informationen zu den Preisen von Amazon Bedrock finden Sie unter Amazon Bedrock Pricing.

Erkennung von Wasserzeichen

Anmerkung

Die Wasserzeichenerkennung für die Amazon Bedrock-Konsole und API ist in der öffentlichen Vorschauversion verfügbar und erkennt nur ein Wasserzeichen, das aus generiert wurde. Titan Image Generator G1 Diese Funktion ist derzeit nur in den us-west-2 Regionen und verfügbar. us-east-1 Die Wasserzeichenerkennung ist eine hochgenaue Erkennung des von generierten Wasserzeichens. Titan Image Generator G1 Bilder, die gegenüber dem Originalbild verändert wurden, führen möglicherweise zu weniger genauen Erkennungsergebnissen.

Dieses Modell fügt allen generierten Bildern ein unsichtbares Wasserzeichen hinzu, um die Verbreitung von Fehlinformationen zu reduzieren, den Urheberrechtsschutz zu verbessern und die Nutzung von Inhalten nachzuverfolgen. Mithilfe einer Wasserzeichenerkennung können Sie überprüfen, ob das Modell ein Bild generiert hat. Das Titan Image Generator G1 Modell überprüft, ob dieses Wasserzeichen vorhanden ist.

Anmerkung

Die API zur Erkennung von Wasserzeichen befindet sich in der Vorschauversion und kann sich ändern. Wir empfehlen, dass Sie eine virtuelle Umgebung für die Verwendung des SDK erstellen. Da APIs zur Erkennung von Wasserzeichen in den neuesten SDKs nicht verfügbar sind, empfehlen wir, dass Sie die neueste Version des SDK aus der virtuellen Umgebung deinstallieren, bevor Sie die Version mit den APIs zur Wasserzeichenerkennung installieren.

Sie können Ihr Bild hochladen, um festzustellen, ob das Bild ein Wasserzeichen von Titan Image Generator G1 enthält. Verwenden Sie die Konsole, um ein Wasserzeichen von diesem Modell zu erkennen, indem Sie die folgenden Schritte ausführen.

Um ein Wasserzeichen zu erkennen mit: Titan Image Generator G1
  1. Öffnen Sie die Amazon-Bedrock-Konsole unter Amazon-Bedrock-Konsole.

  2. Wählen Sie im Navigationsbereich von Amazon Bedrock die Option Übersicht aus. Wählen Sie die Registerkarte Build and Test.

  3. Gehen Sie im Abschnitt Sicherheitsvorkehrungen zu Wasserzeichenerkennung und wählen Sie Wasserzeichenerkennung anzeigen aus.

  4. Wählen Sie Bild hochladen und suchen Sie nach einer Datei im JPG- oder PNG-Format. Die maximal zulässige Dateigröße beträgt 5 MB.

  5. Nach dem Hochladen wird eine Miniaturansicht des Bilds mit dem Namen, der Dateigröße und dem Datum der letzten Änderung angezeigt. Wählen Sie X aus, um das Bild aus dem Upload-Bereich zu löschen oder zu ersetzen.

  6. Wählen Sie Analysieren aus, um mit der Analyse der Wasserzeichenerkennung zu beginnen.

  7. Das Bild wird unter Ergebnisse in der Vorschau angezeigt und gibt an, ob ein Wasserzeichen erkannt wurde, wobei das Wasserzeichen unter dem Bild und ein Banner über dem Bild erkannt wurde. Wenn kein Wasserzeichen erkannt wurde, wird im Text unter dem Bild die Meldung „Wasserzeichen NICHT erkannt“ angezeigt.

  8. Um das nächste Bild zu laden, wählen Sie X in der Miniaturansicht des Bilds im Upload-Bereich und wählen Sie ein neues Bild zur Analyse aus.

Prompt-Engineering-Richtlinien

Maskenaufforderung: Dieser Algorithmus unterteilt Pixel in Konzepte. Benutzer können eine Texteingabeaufforderung eingeben, die basierend auf der Interpretation der Maskenaufforderung die Bereiche des Bildes, die maskiert werden sollen, klassifiziert. Mit der Eingabeaufforderungsoption können komplexere Eingabeaufforderungen interpretiert und die Maske im Segmentierungsalgorithmus kodiert werden.

Bildmaske: Sie können auch eine Bildmaske verwenden, um die Maskenwerte festzulegen. Die Bildmaske kann zur Verbesserung der Genauigkeit mit der Eingabeaufforderung für die Maske kombiniert werden. Die Bildmaskendatei muss den folgenden Parametern entsprechen:

  • Die Maskenbildwerte müssen für das Maskenbild 0 (schwarz) oder 255 (weiß) sein. Der Bildmaskenbereich mit dem Wert 0 wird mit dem Bild aus der Benutzeraufforderung und/oder dem Eingabebild regeneriert.

  • Das Feld maskImage muss eine base64-kodierte Bildzeichenfolge sein.

  • Das Maskenbild muss dieselben Abmessungen wie das Eingabebild haben (gleiche Höhe und Breite).

  • Für das Eingabebild und das Maskenbild können nur PNG- oder JPG-Dateien verwendet werden.

  • Das Maskenbild darf nur schwarze und weiße Pixelwerte verwenden.

  • Das Maskenbild kann nur die RGB-Kanäle verwenden (Alphakanal wird nicht unterstützt).

Weitere Informationen zu Amazon Titan Image Generator G1 Prompt Engineering finden Sie unter Amazon Titan Image Generator G1 Prompt Engineering Best Practices.

Allgemeine Prompt-Engineering-Richtlinien finden Sie unter Prompt-Engineering-Richtlinien.