Stability.ai Diffusion 1.0 图像到图像（使用掩膜）

Stability.ai Diffusion 1.0 模型具有以下推理参数和模型响应，用于使用掩膜进行图像到图像的推理调用。

请求和响应

请求正文在请求body字段中传递给InvokeModel或InvokeModelWithResponseStream。

欲了解更多信息，请参阅 https://platform.stability。 ai/docs/api-reference#tag/v1generation/operation/masking。

Request

Stability.ai Diffusion 1.0 模型具有以下推理参数，用于进行图像到图像（使用掩膜）的推理调用。


{
        "text_prompts": [
            {
                "text": string,
                "weight": float
            }
        ],
        "init_image" : string ,
        "mask_source" : string,
        "mask_image" : string,
        "cfg_scale": float,
        "clip_guidance_preset": string,
        "sampler": string,
        "samples" : int,
        "seed": int,
        "steps": int,
        "style_preset": string,
        "extras" : json object
}

以下是必要参数。

text_prompt –（必要）用于生成的文本提示数组。每个元素都是一个 JSON 对象，其中包含一个提示和该提示的权重。

text – 要传递给模型的提示。

最小值	最大值
0	2000

weight –（可选）模型应当应用于提示的权重。小于零的值表示否定提示。否定提示用于告知模型避免某些概念。weight 的默认值为 1。

init_image –（必要）要用于初始化扩散过程的 base64 编码图像。
mask_source –（必要）确定掩膜的来源。可能的值有：
- MASK_IMAGE_WHITE – 使用 mask_image 中掩膜图像的白色像素作为掩膜。白色像素将被替换，黑色像素保持不变。
- MASK_IMAGE_BLACK – 使用 mask_image 中掩膜图像的黑色像素作为掩膜。黑色像素将被替换，白色像素保持不变。
- INIT_IMAGE_ALPHA – 使用 init_image 中图像的 Alpha 通道作为掩膜。完全透明的像素将被替换，完全不透明的像素保持不变。
mask_image –（必要）要用作 init_image 中源图像掩膜的 base64 编码掩膜图像。必须与源图像的尺寸相同。使用 mask_source 选项来指定应替换哪些像素。

以下是可选参数。

cfg_scale –（可选）确定最终图像对提示的描绘程度。使用较小的数字可提高生成内容的随机性。

默认	最小值	最大值
7	0	35

clip_guidance_preset –（可选）枚举：FAST_BLUE, FAST_GREEN, NONE, SIMPLE, SLOW, SLOWER, SLOWEST。
sampler –（可选）用于扩散过程的采样器。如果省略此值，模型会自动为您选择合适的采样器。

枚举：DDIM, DDPM, K_DPMPP_2M, K_DPMPP_2S_ANCESTRAL, K_DPM_2, K_DPM_2_ANCESTRAL, K_EULER, K_EULER_ANCESTRAL, K_HEUN K_LMS。

samples –（可选）要生成的图像数量。目前，Amazon Bedrock 支持生成一个图像。如果为 samples 提供一个值，该值必须为 1。

默认	最小值	最大值
1	1	1

seed –（可选）种子决定初始噪声设置。使用与上一次运行时相同的种子和相同的设置，以使推理可以创建相似的图像。如果不设置此值，或者此值为 0，它会被设置为一个随机数字。

默认	最小值	最大值
0	0	4294967295

steps –（可选）生成步骤决定对图像进行采样的次数。步骤越多，结果就越准确。

默认	最小值	最大值
30	10	50

style_preset –（可选）用于将图像模型向特定样式引导的样式预设。此样式预设列表可能会发生变化。

枚举：3d-model, analog-film, animé, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, neon-punk, origami, photographic, pixel-art, tile-texture
extras –（可选）传递给引擎的额外参数。请谨慎使用。这些参数用于开发中或实验性的功能，可能会有变更，恕不另行通知。

Response

Stability.ai Diffusion 1.0 模型将返回以下字段，用于进行文本到图像的推理调用。


{
    "result": string,
    "artifacts": [
        {
            "seed": int,
            "base64": string,
            "finishReason": string
        }
    ]
}

result – 操作的结果。如果成功，响应为 success。
artifacts – 一个图像数组，每个请求的图像对应一个。
- seed – 用于生成图像的种子值。
- base64 – 模型生成的 base64 编码图像。
- finishedReason – 图像生成过程的结果。有效值为：
  - SUCCESS – 图像生成过程成功。
  - ERROR – 出现错误。
  - CONTENT_FILTERED – 内容筛选器对图像进行了筛选，图像可能会变得模糊。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

Stable Image Ultra 请求和响应

Stability.ai Stable Diffusion 3