Stability.ai Diffusion 1.0 图像到图像(使用掩膜) - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Stability.ai Diffusion 1.0 图像到图像(使用掩膜)

Stability.ai Diffusion 1.0 模型具有以下推理参数和模型响应,用于使用掩膜进行图像到图像的推理调用。

请求和响应

请求正文在请求body字段中传递给InvokeModelInvokeModelWithResponseStream

有关更多信息,请参阅 https://platform.stability.ai/docs/api-reference#tag/v1generation/operation/masking

Request

Stability.ai Diffusion 1.0 模型具有以下推理参数,用于进行图像到图像(使用掩膜)的推理调用。

{ "text_prompts": [ { "text": string, "weight": float } ], "init_image" : string , "mask_source" : string, "mask_image" : string, "cfg_scale": float, "clip_guidance_preset": string, "sampler": string, "samples" : int, "seed": int, "steps": int, "style_preset": string, "extras" : json object }

以下是必要参数。

  • text_prompt –(必要)用于生成的文本提示数组。每个元素都是一个包含提示和提示权重的JSON对象。

    • text – 要传递给模型的提示。

      最低 最高

      0

      2000

    • weight –(可选)模型应当应用于提示的权重。小于零的值表示否定提示。否定提示用于告知模型避免某些概念。weight 的默认值为 1。

  • init_image –(必要)要用于初始化扩散过程的 base64 编码图像。

  • mask_source –(必要)确定掩膜的来源。可能的值有:

    • MASK_ IMAGE _ WHITE — 使用蒙版图像的白色像素mask_image作为蒙版。白色像素将被替换,黑色像素保持不变。

    • MASK_ IMAGE _ BLACK — 使用蒙版图像的黑色像素mask_image作为蒙版。黑色像素将被替换,白色像素保持不变。

    • INIT_ IMAGE _ ALPHA — 使用中图像的 Alpha 通道init_image作为蒙版,完全透明的像素被替换,完全不透明的像素保持不变。

  • mask_image –(必要)要用作 init_image 中源图像掩膜的 base64 编码掩膜图像。必须与源图像的尺寸相同。使用 mask_source 选项来指定应替换哪些像素。

以下是可选参数。

  • cfg_scale –(可选)确定最终图像对提示的描绘程度。使用较小的数字可提高生成内容的随机性。

    默认 最低 最高

    7

    0

    35

  • clip_guidance_preset –(可选)枚举:FAST_BLUE, FAST_GREEN, NONE, SIMPLE, SLOW, SLOWER, SLOWEST

  • sampler –(可选)用于扩散过程的采样器。如果省略此值,模型会自动为您选择合适的采样器。

    枚举:DDIM, DDPM, K_DPMPP_2M, K_DPMPP_2S_ANCESTRAL, K_DPM_2, K_DPM_2_ANCESTRAL, K_EULER, K_EULER_ANCESTRAL, K_HEUN K_LMS

  • samples –(可选)要生成的图像数量。目前,Amazon Bedrock 支持生成一个图像。如果为 samples 提供一个值,该值必须为 1。

    默认 最低 最高

    1

    1

    1

  • seed –(可选)种子决定初始噪声设置。使用与上一次运行时相同的种子和相同的设置,以使推理可以创建相似的图像。如果不设置此值,或者此值为 0,它会被设置为一个随机数字。

    默认 最低 最高

    0

    0

    4294967295

  • steps –(可选)生成步骤决定对图像进行采样的次数。步骤越多,结果就越准确。

    默认 最低 最高

    30

    10

    50

  • style_preset –(可选)用于将图像模型向特定样式引导的样式预设。此样式预设列表可能会发生变化。

    枚举:3d-model, analog-film, animé, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, neon-punk, origami, photographic, pixel-art, tile-texture

  • extras –(可选)传递给引擎的额外参数。请谨慎使用。这些参数用于开发中或实验性的功能,可能会有变更,恕不另行通知。

Response

Stability.ai Diffusion 1.0 模型将返回以下字段,用于进行文本到图像的推理调用。

{ "result": string, "artifacts": [ { "seed": int, "base64": string, "finishReason": string } ] }
  • result – 操作的结果。如果成功,响应为 success

  • artifacts – 一个图像数组,每个请求的图像对应一个。

    • seed – 用于生成图像的种子值。

    • base64 – 模型生成的 base64 编码图像。

    • finishedReason— 图像生成过程的结果。有效值为:

      • SUCCESS— 图像生成过程成功。

      • ERROR— 发生了错误。

      • CONTENT_ FILTERED — 内容过滤器过滤了图像,图像可能会模糊。