Características Parámetros Microajuste Salida Detección de marcas de agua Directrices sobre ingeniería de peticiones

Titan Image Generator G1Modelo Amazon

Amazon Titan Image Generator G1 es un modelo de generación de imágenes. Genera imágenes a partir del texto y permite a los usuarios cargar y editar una imagen existente. Este modelo puede generar imágenes a partir de texto en lenguaje natural y también se puede utilizar para editar o generar variaciones para una imagen existente o generada. Los usuarios pueden editar una imagen con una petición de texto (sin máscara) o partes de una imagen con una máscara de imagen. Puede ampliar los límites de una imagen con el método de outpainting y rellenar una imagen con el inpainting. También puede generar variaciones de una imagen en función de una petición de texto opcional.

El Titan Image Generator G1 modelo de Amazon admite la personalización instantánea que permite a los creadores importar de 1 a 5 imágenes de referencia y generar una imagen de tema determinada en un contexto novedoso. El modelo conserva las características clave de las imágenes, realiza una transferencia de estilos basada en imágenes sin necesidad de ingeniería inmediata y produce mezclas de estilos a partir de múltiples imágenes de referencia, todo ello sin necesidad de realizar ajustes precisos.

Para seguir respaldando las mejores prácticas en el uso responsable de la IA, los modelos Titan Foundation están diseñados para detectar y eliminar el contenido dañino de los datos, rechazar el contenido inapropiado de las entradas de los usuarios y filtrar los resultados de los modelos que contienen contenido inapropiado (como discursos de odio, blasfemias y violencia). El Titan Image Generator FM añade una marca de agua invisible a todas las imágenes generadas.

Puede utilizar la función de detección de marcas de agua de la consola Amazon Bedrock (versión preliminar) o llamar a la API de detección de marcas de agua de Amazon Bedrock (versión preliminar) para comprobar si una imagen contiene marcas de agua de Titan Image Generator.

Para obtener más información sobre las directrices de Amazon Titan Image Generator G1 Prompt Engineering, consulte Amazon Titan Image Generator G1 Prompt Engineering Best Practices.

ID del modelo: amazon.titan-image-generator-v1
Número máximo de caracteres de entrada: 512 caracteres
Tamaño máximo de la imagen de entrada: 5 MB (solo se admiten algunas resoluciones específicas)
Tamaño máximo de imagen con pintura de entrada/salida: 1408 x 1408 px
Tamaño máximo de imagen utilizando la variación de imagen: 4096 x 4096 px
Idiomas: inglés
Tipo de salida: imagen
Tipos de imagen compatibles: JPEG, JPG, PNG
Tipos de inferencia: rendimiento aprovisionado y bajo demanda
Casos de uso compatibles: generación de imágenes, edición de imágenes, variaciones de imágenes

Características

Generación T ext-to-image (T2I): introduce un mensaje de texto y genera una nueva imagen como salida. La imagen generada captura los conceptos descritos en la petición de texto.
Microajuste de un modelo T2I: importe varias imágenes para capturar su propio estilo y personalización y, a continuación, microajuste el modelo T2I principal. El modelo microajustado genera imágenes que siguen el estilo y la personalización de un usuario específico.
Opciones de edición de imágenes: incluyen inpainting, outpainting, generación de variaciones y edición automática sin máscara de imagen.
Inpainting: utiliza una imagen y una máscara de segmentación como entrada (ya sean especificadas por el usuario o calculadas por el modelo) y reconstruye la región dentro de la máscara. Utilice el inpainting para eliminar los elementos enmascarados y sustituirlos por píxeles de fondo.
Outpainting: utiliza una imagen y una máscara de segmentación como entrada (ya sean especificadas por el usuario o calculadas por el modelo) y genera nuevos píxeles que amplían la región de forma fluida. Utilice un outpainting preciso para conservar los píxeles de la imagen enmascarada al extender la imagen hasta los límites. Utilice el outpainting predeterminado para extender los píxeles de la imagen enmascarada hasta los límites de la imagen en función de la configuración de segmentación.
Variación de imagen: utiliza de 1 a 5 imágenes y un mensaje opcional como entrada. Genera una imagen nueva que conserva el contenido de la imagen o imágenes de entrada, pero varía su estilo y fondo.

nota

si utiliza un modelo ajustado, no puede utilizar las funciones de pintura interna o externa de la API o del modelo.

Parámetros

Para obtener información sobre los parámetros de Titan Image Generator G1 inferencia de Amazon, consulte Parámetros de Titan Image Generator G1inferencia de Amazon.

Microajuste

Para obtener más información sobre cómo ajustar el Titan Image Generator G1 modelo de Amazon, consulta las páginas siguientes.

Titan Image Generator G1ajustes y precios

El modelo utiliza la siguiente fórmula de ejemplo para calcular el precio total por trabajo:

Precio total = pasos * Tamaño del lote * Precio por imagen vista

Valores mínimos (auto):

Pasos mínimos (auto): 500
Tamaño mínimo de lote: 8
Tasa de aprendizaje predeterminada: 0,00001
Precio por imagen vista: 0,005

Ajuste preciso de la configuración de los hiperparámetros

Pasos: el número de veces que el modelo se expone a cada lote. No hay un número de pasos predeterminado establecido. Debe seleccionar un número entre 10 y 40 000 o un valor de cadena de «Automático».

Configuración de pasos: automática: Amazon Bedrock determina un valor razonable en función de la información de formación. Seleccione esta opción para priorizar el rendimiento del modelo por encima del coste de la formación. El número de pasos se determina automáticamente. Este número suele oscilar entre 1000 y 8000 en función del conjunto de datos. Los costos de trabajo se ven afectados por la cantidad de pasos utilizados para exponer el modelo a los datos. Consulte la sección de ejemplos de precios de los detalles de precios para comprender cómo se calcula el costo del trabajo. (Consulta la tabla de ejemplo anterior para ver cómo se relaciona el recuento de pasos con el número de imágenes cuando se selecciona Automático).

Configuración de pasos: personalizada: puedes introducir el número de pasos en los que quieres que Bedrock exponga tu modelo personalizado a los datos de entrenamiento. Este valor puede estar entre 10 y 40 000. Puede reducir el coste por imagen producida por el modelo utilizando un valor de recuento de pasos inferior.

Tamaño del lote: el número de muestras procesadas antes de actualizar los parámetros del modelo. Este valor está entre 8 y 192 y es un múltiplo de 8.

Tasa de aprendizaje: la velocidad a la que se actualizan los parámetros del modelo después de cada lote de datos de entrenamiento. Se trata de un valor flotante entre 0 y 1. La tasa de aprendizaje se establece en 0,00001 de forma predeterminada.

Para obtener más información sobre el procedimiento de ajuste, consulte Enviar un trabajo de personalización del modelo.

Salida

Titan Image Generator G1utiliza el tamaño y la calidad de la imagen de salida para determinar el precio de una imagen. Titan Image Generator G1tiene dos segmentos de precios según el tamaño: uno para 512 x 512 imágenes y otro para 1024 x 1024 imágenes. El precio se basa en el tamaño de la imagen (alto x ancho), inferior o igual a 512 x 512 o superior a 512 x 512.

Para obtener más información sobre los precios de Amazon Bedrock, consulta los precios de Amazon Bedrock.

Detección de marcas de agua

nota

La detección de marcas de agua para la consola y la API de Amazon Bedrock está disponible en la versión preliminar pública y solo detectará una marca de agua generada desde ella. Titan Image Generator G1 Actualmente, esta función solo está disponible en las us-west-2 regiones y. us-east-1 La detección de marcas de agua es una detección muy precisa de la marca de agua generada por. Titan Image Generator G1 Las imágenes modificadas con respecto a la imagen original pueden producir resultados de detección menos precisos.

Este modelo añade una marca de agua invisible a todas las imágenes generadas para reducir la difusión de información errónea, contribuir a la protección de los derechos de autor y hacer un seguimiento del uso del contenido. Hay disponible una función de detección de marcas de agua para ayudarle a confirmar si el Titan Image Generator G1 modelo generó una imagen, lo que permite comprobar la existencia de esta marca de agua.

nota

La API de detección de marcas de agua está en versión preliminar y está sujeta a cambios. Le recomendamos que cree un entorno virtual para usar el SDK. Como las API de detección de marcas de agua no están disponibles en los SDK más recientes, le recomendamos que desinstale la última versión del SDK del entorno virtual antes de instalar la versión con las API de detección de marcas de agua.

Puedes cargar tu imagen para detectar si Titan Image Generator G1 hay una marca de agua en la imagen. Usa la consola para detectar una marca de agua de este modelo siguiendo los pasos que se indican a continuación.

Para detectar una marca de agua con: Titan Image Generator G1

Abra la consola de Amazon Bedrock en Consola de Amazon Bedrock.
Seleccione Descripción general en el panel de navegación de Amazon Bedrock. Seleccione la pestaña Crear y probar.
En la sección Medidas de seguridad, vaya a Detección de marcas de agua y seleccione Ver detección de marcas de agua.
Selecciona Cargar imagen y busca un archivo que esté en formato JPG o PNG. El tamaño máximo de archivo permitido es de 5 MB.
Una vez cargada, se muestra una miniatura de la imagen con el nombre, el tamaño del archivo y la fecha de la última modificación. Seleccione X para eliminar o reemplazar la imagen de la sección de carga.
Seleccione Analizar para iniciar el análisis de detección de marcas de agua.
La vista previa de la imagen se muestra en Resultados e indica si se ha detectado una marca de agua con una marca de agua detectada debajo de la imagen y una pancarta sobre la imagen. Si no se detecta ninguna marca de agua, el texto situado debajo de la imagen mostrará que no se ha detectado ninguna marca de agua.
Para cargar la siguiente imagen, selecciona una X en la miniatura de la imagen en la sección Cargar y elige una nueva imagen para analizarla.

Directrices sobre ingeniería de peticiones

Petición de máscara: este algoritmo clasifica los píxeles en conceptos. El usuario puede enviar un mensaje de texto que se utilizará para clasificar las áreas de la imagen que se van a enmascarar, en función de la interpretación de la petición de máscara. La opción de petición puede interpretar peticiones más complejas y codificar la máscara en el algoritmo de segmentación.

Máscara de imagen: también puede utilizar una máscara de imagen para establecer los valores de la máscara. La máscara de imagen se puede combinar con una entrada de petición para que la máscara mejore la precisión. El archivo de máscara de imagen debe cumplir los siguientes parámetros:

Los valores de la imagen de máscara deben ser 0 (negro) o 255 (blanco) para la imagen de máscara. El área de la máscara de imagen con el valor 0 se regenerará con la imagen de la petición del usuario o la imagen de entrada.
El campo maskImage debe ser una cadena de imagen codificada en base64.
La imagen de la máscara debe tener las mismas dimensiones que la imagen de entrada (igual altura y anchura).
Solo se pueden usar archivos PNG o JPG para la imagen de entrada y la imagen de máscara.
La imagen de máscara solo debe usar valores de píxeles en blanco y negro.
La imagen de máscara solo puede utilizar los canales RGB (no se admite el canal alfa).

Para obtener más información sobre Amazon Titan Image Generator G1 Prompt Engineering, consulte Amazon Titan Image Generator G1 Prompt Engineering Best Practices.

Para ver las pautas generales de ingeniería de peticiones, consulte las Directrices de ingeniería de peticiones.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Amazon Titan Multimodal Embeddings G1

Estudio Amazon Bedrock