Atributos Parâmetros Ajuste fino Saída Detecção de marca d'água Diretrizes da engenharia de prompts

Titan Image Generator G1Modelo Amazon

A Amazon Titan Image Generator G1 é um modelo de geração de imagens. Ele gera imagens usando texto e permite que os usuários carreguem e editem uma imagem existente. Esse modelo pode gerar imagens a partir de texto em linguagem natural e também pode ser usado para editar ou gerar variações para uma imagem existente ou gerada. Os usuários podem editar uma imagem com um prompt de texto (sem máscara) ou partes de uma imagem com uma máscara de imagem. Você pode estender os limites de uma imagem com pintura externa e preencher uma imagem com pintura embutida. Ele também pode gerar variações de uma imagem com base em um prompt de texto opcional.

O Titan Image Generator G1 modelo da Amazon oferece suporte à personalização instantânea que permite aos criadores importar de 1 a 5 imagens de referência e gerar uma determinada imagem de assunto em um novo contexto. O modelo preserva as principais características das imagens, realiza a transferência de estilo baseada em imagem sem engenharia imediata e produz uma mistura de estilos a partir de várias imagens de referência, tudo sem ajustes finos.

Para continuar apoiando as melhores práticas no uso responsável da IA, os modelos da Titan Foundation são criados para detectar e remover conteúdo prejudicial nos dados, rejeitar conteúdo impróprio na entrada do usuário e filtrar as saídas dos modelos que contêm conteúdo impróprio (como discurso de ódio, palavrões e violência). O Titan Image Generator FM adiciona uma marca d'água invisível a todas as imagens geradas.

Você pode usar o recurso de detecção de marca d'água no console Amazon Bedrock (versão prévia) ou chamar a API de detecção de marca d'água do Amazon Bedrock (versão prévia) para verificar se uma imagem contém uma marca d'água do Titan Image Generator.

Para obter mais informações sobre as diretrizes de engenharia Titan Image Generator G1 rápida da Amazon, consulte Amazon Titan Image Generator G1 Prompt Engineering Best Practices.

ID de modelo: amazon.titan-image-generator-v1
Máximo de caracteres de entrada — 512 caracteres
Tamanho máximo da imagem de entrada — 5 MB (somente algumas resoluções específicas são suportadas)
Tamanho máximo da imagem usando pintura interna/externa — 1.408 x 1.408 px
Tamanho máximo da imagem usando variação de imagem: 4096x4096px
Idiomas: inglês
Tipo de saída: imagem
Tipos de imagem compatíveis: JPEG, JPG, PNG
Tipos de inferência: throughput sob demanda e provisionado
Casos de uso compatíveis: geração de imagens, edição de imagens, variações de imagem

Atributos

Geração T ext-to-image (T2I) — Insira um prompt de texto e gere uma nova imagem como saída. A imagem gerada captura os conceitos descritos pelo prompt de texto.
Ajuste fino de um modelo T2I: importe várias imagens para capturar seu próprio estilo e personalização, depois ajuste o modelo T2I principal. O modelo ajustado gera imagens que seguem o estilo e a personalização de um usuário específico.
Opções de edição de imagem: inclui pintura embutida, pintura externa, geração de variações e edição automática sem máscara de imagem.
Pintura embutida: usa uma imagem e uma máscara de segmentação como entrada (seja do usuário ou estimada pelo modelo) e reconstrói a região dentro da máscara. Use a pintura embutida para remover elementos mascarados e substituí-los por pixels de plano de fundo.
Pintura externa: usa uma imagem e uma máscara de segmentação como entrada (seja do usuário ou estimada pelo modelo) e gera novos pixels que estendem perfeitamente a região. Use uma pintura externa precisa para preservar os pixels da imagem mascarada ao estender a imagem até os limites. Use a pintura externa padrão para estender os pixels da imagem mascarada até os limites da imagem com base nas configurações de segmentação.
Variação de imagem — usa de 1 a 5 imagens e um prompt opcional como entrada. Ele gera uma nova imagem que preserva o conteúdo da (s) imagem (s) de entrada, mas varia seu estilo e plano de fundo.

nota

se você estiver usando um modelo ajustado, não poderá usar os recursos de pintura embutida ou de pintura externa da API ou do modelo.

Parâmetros

Para obter informações sobre os parâmetros de Titan Image Generator G1 inferência da Amazon, consulte Parâmetros de Titan Image Generator G1inferência da Amazon.

Ajuste fino

Para obter mais informações sobre como ajustar o Titan Image Generator G1 modelo da Amazon, consulte as páginas a seguir.

Titan Image Generator G1ajuste fino e preços

O modelo usa a seguinte fórmula de exemplo para calcular o preço total por trabalho:

Preço total = etapas * Tamanho do lote * Preço por imagem vista

Valores mínimos (auto):

Etapas mínimas (auto) - 500
Tamanho mínimo do lote - 8
Taxa de aprendizado padrão - 0,00001
Preço por imagem vista - 0,005

Ajustando as configurações de hiperparâmetros

Etapas — O número de vezes que o modelo é exposto a cada lote. Não há um conjunto padrão de contagem de etapas. Você deve selecionar um número entre 10 e 40.000 ou um valor de string de “Auto”.

Configurações de etapas - Automático — O Amazon Bedrock determina um valor razoável com base nas informações de treinamento. Selecione essa opção para priorizar o desempenho do modelo em relação ao custo do treinamento. O número de etapas é determinado automaticamente. Esse número normalmente estará entre 1.000 e 8.000 com base no seu conjunto de dados. Os custos do trabalho são afetados pelo número de etapas usadas para expor o modelo aos dados. Consulte a seção de exemplos de preços dos detalhes de preços para entender como o custo do trabalho é calculado. (Consulte a tabela de exemplo acima para ver como a contagem de etapas está relacionada ao número de imagens quando a opção Automático é selecionada.)

Configurações de etapas - Personalizadas - Você pode inserir o número de etapas em que deseja que o Bedrock exponha seu modelo personalizado aos dados de treinamento. Esse valor pode estar entre 10 e 40.000. Você pode reduzir o custo por imagem produzida pelo modelo usando um valor menor de contagem de etapas.

Tamanho do lote — O número de amostras processadas antes da atualização dos parâmetros do modelo. Esse valor está entre 8 e 192 e é um múltiplo de 8.

Taxa de aprendizado — A taxa na qual os parâmetros do modelo são atualizados após cada lote de dados de treinamento. Esse é um valor flutuante entre 0 e 1. A taxa de aprendizado é definida como 0,00001 por padrão.

Para obter mais informações sobre o procedimento de ajuste fino, consulte Enviar um trabalho de personalização do modelo.

Saída

Titan Image Generator G1usa o tamanho e a qualidade da imagem de saída para determinar o preço de uma imagem. Titan Image Generator G1tem dois segmentos de preços com base no tamanho: um para 512*512 imagens e outro para 1024*1024 imagens. O preço é baseado no tamanho da imagem, altura*largura, menor ou igual a 512*512 ou maior que 512*512.

Para obter mais informações sobre os preços do Amazon Bedrock, consulte Preços do Amazon Bedrock.

Detecção de marca d'água

nota

A detecção de marca d'água para o console e a API do Amazon Bedrock está disponível na versão prévia pública e detectará somente uma marca d'água gerada a partir de. Titan Image Generator G1 Atualmente, esse recurso está disponível apenas us-east-1 nas regiões us-west-2 e. A detecção de marca d'água é uma detecção altamente precisa da marca d'água gerada por. Titan Image Generator G1 Imagens modificadas da imagem original podem produzir resultados de detecção menos precisos.

Esse modelo adiciona uma marca d'água invisível a todas as imagens geradas para reduzir a disseminação de informações erradas, auxiliar na proteção de direitos autorais e rastrear o uso do conteúdo. Uma detecção de marca d'água está disponível para ajudá-lo a confirmar se uma imagem foi gerada pelo Titan Image Generator G1 modelo, que verifica a existência dessa marca d'água.

nota

A API de detecção de marcas d'água está em versão prévia e está sujeita a alterações. Recomendamos que você crie um ambiente virtual para usar o SDK. Como as APIs de detecção de marca d'água não estão disponíveis nos SDKs mais recentes, recomendamos que você desinstale a versão mais recente do SDK do ambiente virtual antes de instalar a versão com as APIs de detecção de marca d'água.

Você pode carregar sua imagem para detectar se uma marca d'água de Titan Image Generator G1 está presente na imagem. Use o console para detectar uma marca d'água desse modelo seguindo as etapas abaixo.

Para detectar uma marca d'água comTitan Image Generator G1:

Abra o console Amazon Bedrock no console Amazon Bedrock
Selecione Visão geral no painel de navegação no Amazon Bedrock. Escolha a guia Criar e testar.
Na seção Salvaguardas, vá para Detecção de marca d'água e escolha Exibir detecção de marca d'água.
Selecione Carregar imagem e localize um arquivo que esteja no formato JPG ou PNG. O tamanho máximo de arquivo permitido é de 5 MB.
Depois de carregada, uma miniatura da imagem é exibida com o nome, o tamanho do arquivo e a data da última modificação. Selecione X para excluir ou substituir a imagem na seção Carregar.
Selecione Analisar para iniciar a análise de detecção de marca d'água.
A imagem é visualizada em Resultados e indica se uma marca d'água foi detectada com a Marca d'água detectada abaixo da imagem e um banner na imagem. Se nenhuma marca d'água for detectada, o texto abaixo da imagem dirá Marca d'água NÃO detectada.
Para carregar a próxima imagem, selecione X na miniatura da imagem na seção Carregar e escolha uma nova imagem para analisar.

Diretrizes da engenharia de prompts

Prompt de máscara: esse algoritmo classifica os pixels em conceitos. O usuário pode fornecer um prompt de texto que será usado para classificar as áreas da imagem a serem mascaradas, com base na interpretação do prompt de máscara. A opção de prompt pode interpretar prompts mais complexos e codificar a máscara no algoritmo de segmentação.

Máscara de imagem: você também pode usar uma máscara de imagem para definir os valores da máscara. A máscara de imagem pode ser combinada com o prompt de entrada da máscara para melhorar a precisão. O arquivo da máscara de imagem deve estar de acordo com os seguintes parâmetros:

Os valores da imagem de máscara devem ser 0 (preto) ou 255 (branco) para a imagem de máscara. A área da máscara de imagem com o valor 0 será regenerada com a imagem do prompt do usuário e/ou a imagem de entrada.
O campo maskImage deve ser uma string de imagem codificada em base64.
A imagem de máscara deve ter as mesmas dimensões da imagem de entrada (mesma altura e largura).
Somente arquivos PNG ou JPG podem ser usados para a imagem de entrada e a imagem de máscara.
A imagem de máscara deve usar somente valores de pixels em preto e branco.
A imagem de máscara só pode usar os canais RGB (canal alfa não compatível).

Para obter mais informações sobre a engenharia Titan Image Generator G1 rápida da Amazon, consulte as melhores práticas de engenharia da Amazon Titan Image Generator G1 Prompt.

Para conferir diretrizes gerais de engenharia de prompts, consulte Diretrizes da engenharia de prompts.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Amazon Titan Multimodal Embeddings G1

Estúdio Amazon Bedrock