Geração e edição de imagens - Amazon Nova

Geração e edição de imagens

O Amazon Nova Canvas está disponível por meio da API InvokeModel do Bedrock e aceita os parâmetros de inferência e respostas de modelo a seguir ao realizar uma inferência do modelo.

Formato de solicitação e resposta da geração de imagens

Ao fazer uma chamada de InvokeModel usando o modelo Amazon Nova Canvas, substitua o campo body da solicitação pelo formato correspondente ao caso de uso. Todas as tarefas compartilham um objeto imageGenerationConfig, mas cada tarefa tem um objeto de parâmetros específico da tarefa. Os casos de uso a seguir são compatíveis:

Valor do tipo da tarefa Campo de parâmetro da tarefa Categoria da tarefa Descrição
TEXT_IMAGE somente com texto textToImageParams Geração Gere uma imagem usando um prompt de texto.
TEXT_IMAGE com condicionamento de imagem textToImageParams Geração Forneça uma imagem de condicionamento de entrada junto com um prompt de texto para gerar uma imagem que siga o layout e a composição da imagem de condicionamento.
COLOR_GUIDED_GENERATION colorGuidedGenerationParams Geração Forneça uma lista de valores de cores em formato hexadecimal (por exemplo, #FF9800) junto com um prompt de texto e uma imagem de referência opcional para gerar uma imagem que siga a paleta de cores especificada.
IMAGE_VARIATION imageVariationParams Geração Forneça uma ou mais imagens de entrada, com ou sem um prompt de texto, para influenciar a imagem gerada. É possível usar esse recurso para influenciar o estilo visual da imagem gerada (quando usado com um prompt de texto), para gerar variações de uma única imagem (quando usado sem um prompt de texto) e para outros efeitos criativos e de controle.
INPAINTING inPaintingParams Como editar Modifique uma imagem alterando a área dentro de uma região mascarada. É possível usar esse recurso para adicionar, remover ou substituir elementos de uma imagem.
OUTPAINTING outPaintingParams Como editar Modifique uma imagem alterando a área fora de uma região mascarada. É possível usar esse recurso para substituir o plano de fundo atrás de um assunto.
BACKGROUND_REMOVAL backgroundRemovalParams Como editar Remova automaticamente o plano de fundo de qualquer imagem, substituindo o plano de fundo por pixels transparentes. Esse recurso pode ser útil quando você quiser compor a imagem posteriormente com outros elementos em uma aplicação de edição de imagens, apresentação ou site. Também é possível alterar facilmente o plano de fundo para uma cor sólida usando um código personalizado.
VIRTUAL_TRY_ON virtualTryOnParams Como editar Forneça uma imagem de origem e uma imagem de referência, sobrepondo um objeto da imagem de referência sobre a imagem de origem. Esse recurso pode ser usado para visualizar roupas e acessórios em diferentes modelos ou poses, alterar o estilo e a aparência de um objeto ou artigo de roupa ou transferir estilos e designs de um objeto para outro.

Imagens de entrada para geração de imagens

Muitos tipos de tarefas exigem que uma ou mais imagens de entrada sejam incluídas na solicitação. Qualquer imagem usada na solicitação deve ser codificada como uma string Base64. Geralmente, as imagens podem estar no formato PNG ou JPEG e devem ter 8 bits por canal de cor (RGB). As imagens PNG podem conter um canal alfa adicional, mas esse canal não deve conter pixels transparentes ou translúcidos. Para obter detalhes específicos sobre as dimensões de imagem de entrada compatíveis, consulte Resoluções de imagem compatíveis.

Uma imagem com máscara é uma imagem que indica a área onde aplicar o recurso de inpainting ou outpainting. Essa imagem pode conter somente pixels em preto puro e branco puro.

Para solicitações de inpainting, a área colorida em preto é denominada a máscara e será alterada. O restante da imagem com máscara deve conter apenas pixels brancos puros. Pixels brancos puros indicam a área fora da máscara.

Para solicitações de outpainting, a área colorida em branco será alterada pelo modelo.

As imagens com máscara não devem conter pixels que não sejam preto puro ou branco puro. Se você estiver usando uma imagem JPEG como máscara, ela deverá ser compactada com 100% de qualidade para evitar a introdução de pixels não brancos ou não pretos durante a compactação.

Para exemplos de como codificar ou decodificar uma imagem de ou para uma string Base64, consulte os exemplos de código.

Mascarar imagens

Quando você está editando uma imagem, uma máscara é uma forma de definir as regiões a serem editadas. Você pode definir uma máscara usando uma de três opções:

  • maskPrompt: escreva um prompt de texto em linguagem natural para descrever as partes da imagem a serem mascaradas.

  • maskImage: uma imagem em preto e branco em que os pixels pretos puros indicam a área dentro da máscara e os pixels brancos puros indicam a área fora da máscara.

    Para uma solicitação de inpainting, os pixels pretos serão alterados pelo modelo. Para solicitações de outpainting, os pixels brancos serão alterados.

  • garmentBasedMask: uma máscara baseada em imagem que define uma região a ser substituída junto com algumas opções de estilo limitadas.

Você pode usar uma ferramenta de edição de fotos para desenhar máscaras ou criá-las com seu próprio código personalizado. Do contrário, use o campo maskPrompt para permitir que o modelo infira a máscara.

Resoluções de imagem compatíveis

Você pode especificar qualquer resolução de saída para uma tarefa de geração, desde que ela atenda aos seguintes requisitos:

  • Cada lado deve ter entre 320 e 4096 pixels, inclusive.

  • Cada lado deve ser divisível igualmente por 16.

  • A taxa de proporção deve estar entre 1:4 e 4:1. Ou seja, um lado não pode ser mais de quatro vezes maior que o outro lado.

  • A contagem total de pixels deve ser menor que 4.194.304.

A maioria dessas mesmas restrições também se aplica às imagens de entrada. No entanto, os lados das imagens não precisam ser divisíveis igualmente por 16.