Funzionalità Parametri Ottimizzazione Output Rilevamento della filigrana Linee guida sulla progettazione dei prompt

Titan Image Generator G1Modello Amazon

Amazon Titan Image Generator G1 è un modello di generazione di immagini. Genera immagini dal testo e consente agli utenti di caricare e modificare un'immagine esistente. Questo modello può generare immagini da testo in linguaggio naturale e può essere utilizzato anche per modificare o generare variazioni per un'immagine esistente o generata. Gli utenti possono modificare un'immagine con un prompt di testo (senza maschera) o parti di un'immagine con una maschera di immagine. È possibile estendere i confini di un'immagine con outpainting e riempire un'immagine con inpainting. Può anche generare variazioni di un'immagine in base a un prompt di testo opzionale.

Titan Image Generator G1Il modello Amazon supporta la personalizzazione istantanea che consente ai creatori di importare da 1 a 5 immagini di riferimento e generare una determinata immagine del soggetto in un nuovo contesto. Il modello conserva le caratteristiche chiave delle immagini, esegue il trasferimento di stili basato sulle immagini senza necessità di progettazione e produce un mix di stili a partire da più immagini di riferimento, il tutto senza alcuna regolazione precisa.

Per continuare a supportare le migliori pratiche nell'uso responsabile dell'intelligenza artificiale, i modelli Titan Foundation sono progettati per rilevare e rimuovere i contenuti dannosi nei dati, rifiutare i contenuti inappropriati nell'input dell'utente e filtrare gli output dei modelli che contengono contenuti inappropriati (come incitamento all'odio, parolacce e violenza). Titan Image Generator FM aggiunge una filigrana invisibile a tutte le immagini generate.

Puoi utilizzare la funzione di rilevamento della filigrana nella console Amazon Bedrock (anteprima) o chiamare l'API di rilevamento della filigrana di Amazon Bedrock (anteprima) per verificare se un'immagine contiene filigrana di Titan Image Generator.

Per ulteriori informazioni sulle linee guida ingegneristiche di Amazon Titan Image Generator G1 Prompt, consulta Amazon Titan Image Generator G1 Prompt Engineering Best Practices.

ID modello: amazon.titan-image-generator-v1
Numero massimo di caratteri di input: 512 caratteri
Dimensione massima dell'immagine di input: 5 MB (sono supportate solo alcune risoluzioni specifiche)
Dimensione massima dell'immagine con in/outpainting: 1.408 x 1.408 px
Dimensione massima dell'immagine utilizzando la variazione dell'immagine: 4.096 x 4.096 px
Lingue: inglese
Tipo di output: immagine
Tipi di immagini supportati: JPEG, JPG, PNG
Tipi di inferenza: on demand, velocità di trasmissione effettiva assegnata
Casi d'uso supportati: generazione di immagini, modifica delle immagini, variazioni delle immagini

Funzionalità

Generazione T ext-to-image (T2I): immette un prompt di testo e genera una nuova immagine come output. L'immagine generata acquisisce i concetti descritti dal prompt di testo.
Ottimizzazione di un modello T2I: importa diverse immagini per immortalare il tuo stile e la tua personalizzazione, quindi ottimizza il modello T2I principale. Il modello ottimizzato genera immagini che seguono lo stile e la personalizzazione di un utente specifico.
Opzioni di modifica delle immagini: includono inpainting, outpainting, generazione di variazioni e modifica automatica senza maschera di immagine.
Inpainting: utilizza un'immagine e una maschera di segmentazione come input (fornite dall'utente o da una stima del modello) e ricostruisce la regione all'interno della maschera. Utilizza l'inpainting per rimuovere gli elementi con maschera e sostituirli con pixel di sfondo.
Outpainting: utilizza un'immagine e una maschera di segmentazione come input (forniti dall'utente o da una stima del modello) e genera nuovi pixel che estendono senza interruzioni la regione. Utilizza l'outpainting preciso per preservare i pixel dell'immagine con maschera quando estendi l'immagine fino ai confini. Utilizza l'outpainting predefinito per estendere i pixel dell'immagine con maschera fino ai confini dell'immagine in base alle impostazioni di segmentazione.
Variazione dell'immagine: utilizza da 1 a 5 immagini e un prompt opzionale come input. Genera una nuova immagine che conserva il contenuto delle immagini di input, ma ne modifica lo stile e lo sfondo.

Nota

se state usando un modello perfezionato, non potete usare le funzioni di inpainting o outpainting dell'API o del modello.

Parametri

Per informazioni sui parametri di Titan Image Generator G1 inferenza di Amazon, consulta Parametri di Titan Image Generator G1inferenza di Amazon.

Ottimizzazione

Per ulteriori informazioni sulla messa a punto del Titan Image Generator G1 modello Amazon, consulta le pagine seguenti.

Titan Image Generator G1messa a punto e prezzi

Il modello utilizza la seguente formula di esempio per calcolare il prezzo totale per lavoro:

Prezzo totale = Fasi * Dimensione del batch * Prezzo per immagine vista

Valori minimi (auto):

Passi minimi (auto) - 500
Dimensione minima del lotto: 8
Tasso di apprendimento predefinito: 0,00001
Prezzo per immagine vista: 0,005

Ottimizzazione delle impostazioni degli iperparametri

Fasi: il numero di volte in cui il modello viene esposto a ciascun batch. Non è impostato un conteggio dei passaggi predefinito. È necessario selezionare un numero compreso tra 10 e 40.000 o un valore String pari a «Auto».

Impostazioni dei passaggi - Automatico: Amazon Bedrock determina un valore ragionevole in base alle informazioni di formazione. Seleziona questa opzione per dare priorità alle prestazioni del modello rispetto ai costi di formazione. Il numero di passaggi viene determinato automaticamente. Questo numero sarà in genere compreso tra 1.000 e 8.000 in base al set di dati. I costi del lavoro sono influenzati dal numero di passaggi utilizzati per esporre il modello ai dati. Consulta la sezione dedicata agli esempi di prezzo dei dettagli sui prezzi per capire come viene calcolato il costo del lavoro. (Vedi la tabella di esempio sopra riportata per vedere in che modo il conteggio dei passaggi è correlato al numero di immagini quando è selezionata l'opzione Auto).

Impostazioni dei passaggi - Personalizzate: puoi inserire il numero di passaggi in cui desideri che Bedrock esponga il tuo modello personalizzato ai dati di allenamento. Questo valore può essere compreso tra 10 e 40.000. È possibile ridurre il costo per immagine prodotta dal modello utilizzando un valore di conteggio dei passaggi inferiore.

Dimensione del batch: il numero di campioni elaborati prima dell'aggiornamento dei parametri del modello. Questo valore è compreso tra 8 e 192 ed è un multiplo di 8.

Tasso di apprendimento: la velocità con cui i parametri del modello vengono aggiornati dopo ogni batch di dati di addestramento. Si tratta di un valore flottante compreso tra 0 e 1. Il tasso di apprendimento è impostato su 0,00001 per impostazione predefinita.

Per ulteriori informazioni sulla procedura di messa a punto, consulta Inviare un processo di personalizzazione del modello.

Output

Titan Image Generator G1utilizza la dimensione e la qualità dell'immagine in uscita per determinare il prezzo di un'immagine. Titan Image Generator G1ha due segmenti di prezzo in base alle dimensioni: uno per 512*512 immagini e un altro per 1024*1024 immagini. I prezzi si basano sulla dimensione dell'immagine (altezza*larghezza), minore o uguale a 512*512 o superiore a 512*512.

Per ulteriori informazioni sui prezzi di Amazon Bedrock, consulta la pagina dei prezzi di Amazon Bedrock.

Rilevamento della filigrana

Nota

Il rilevamento della filigrana per la console e l'API Amazon Bedrock è disponibile nella versione di anteprima pubblica e rileva solo una filigrana generata da. Titan Image Generator G1 Questa funzionalità è attualmente disponibile solo nelle regioni e. us-west-2 us-east-1 Il rilevamento della filigrana è un rilevamento estremamente accurato della filigrana generata da. Titan Image Generator G1 Le immagini modificate rispetto all'immagine originale possono produrre risultati di rilevamento meno accurati.

Questo modello aggiunge una filigrana invisibile a tutte le immagini generate per ridurre la diffusione di informazioni errate, contribuire alla protezione del copyright e tenere traccia dell'utilizzo dei contenuti. È disponibile un sistema di rilevamento della filigrana per aiutarvi a confermare se un'immagine è stata generata dal Titan Image Generator G1 modello, che verifica l'esistenza di tale filigrana.

Nota

L'API Watermark Detection è disponibile in anteprima ed è soggetta a modifiche. Ti consigliamo di creare un ambiente virtuale per utilizzare l'SDK. Poiché le API di rilevamento delle filigrane non sono disponibili negli SDK più recenti, consigliamo di disinstallare l'ultima versione dell'SDK dall'ambiente virtuale prima di installare la versione con le API di rilevamento delle filigrane.

Puoi caricare l'immagine per rilevare se sull'immagine è presente una filigrana di. Titan Image Generator G1 Usa la console per rilevare una filigrana da questo modello seguendo i passaggi seguenti.

Per rilevare una filigrana con: Titan Image Generator G1

Apri la console Amazon Bedrock.
Seleziona Panoramica dal riquadro di navigazione in Amazon Bedrock. Scegli la scheda Build and Test.
Nella sezione Salvaguardie, vai a Rilevamento filigrana e scegli Visualizza rilevamento filigrana.
Seleziona Carica immagine e individua un file in formato JPG o PNG. La dimensione massima del file consentita è di 5 MB.
Una volta caricata, viene mostrata una miniatura dell'immagine con il nome, la dimensione del file e l'ultima data di modifica. Seleziona X per eliminare o sostituire l'immagine dalla sezione Carica.
Seleziona Analizza per iniziare l'analisi del rilevamento delle filigrane.
L'immagine viene visualizzata in anteprima nella sezione Risultati e indica se viene rilevata una filigrana con Filigrana rilevata sotto l'immagine e un banner sull'immagine. Se non viene rilevata alcuna filigrana, il testo sotto l'immagine riporterà la dicitura Filigrana NON rilevata.
Per caricare l'immagine successiva, seleziona X nella miniatura dell'immagine nella sezione Carica e scegli una nuova immagine da analizzare.

Linee guida sulla progettazione dei prompt

Prompt maschera: questo algoritmo classifica i pixel in concetti. L'utente può fornire una richiesta di testo che verrà utilizzata per classificare le aree dell'immagine a cui applicare la maschera, in base all'interpretazione del prompt di maschera. L'opzione prompt può interpretare prompt più complessi e codificare la maschera nell'algoritmo di segmentazione.

Maschera di immagine: puoi anche utilizzare una maschera di immagine per impostare i valori della maschera. La maschera di immagine può essere combinata con l'input del prompt della maschera per migliorare la precisione. Il file maschera immagine deve rispettare i seguenti parametri:

I valori dell'immagine della maschera devono essere 0 (nero) o 255 (bianco) per l'immagine della maschera. L'area della maschera dell'immagine con il valore 0 verrà rigenerata con l'immagine del prompt dell'utente e/o dell'immagine di input.
Il campo maskImage deve essere una stringa di immagine con codifica base64.
L'immagine della maschera deve avere le stesse dimensioni dell'immagine di input (stessa altezza e larghezza).
È possibile utilizzare solo file PNG o JPG per l'immagine di input e l'immagine della maschera.
L'immagine della maschera deve utilizzare solo valori di pixel in bianco e nero.
L'immagine della maschera può utilizzare solo i canali RGB (il canale alfa non è supportato).

Per ulteriori informazioni sull'ingegneria Titan Image Generator G1 dei prompt di Amazon, consulta Amazon Titan Image Generator G1 Prompt Engineering Best Practices.

Per le linee guida generali sulla progettazione dei prompt, consulta Linee guida sulla progettazione dei prompt.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Amazon Titan Multimodal Embeddings G1

Amazon Bedrock Studio