本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Stability.ai Diffusion 1.0 图像到图像(使用掩膜)
Stability.ai Diffusion 1.0 模型具有以下推理参数和模型响应,用于使用掩膜进行图像到图像的推理调用。
请求和响应
请求正文在请求body
字段中传递给InvokeModel或InvokeModelWithResponseStream。
有关更多信息,请参阅 https://platform.stability.ai/docs/api-reference#tag/v1generation/operation/masking
- Request
-
Stability.ai Diffusion 1.0 模型具有以下推理参数,用于进行图像到图像(使用掩膜)的推理调用。
{ "text_prompts": [ { "text": string, "weight": float } ], "init_image" : string , "mask_source" : string, "mask_image" : string, "cfg_scale": float, "clip_guidance_preset": string, "sampler": string, "samples" : int, "seed": int, "steps": int, "style_preset": string, "extras" : json object }
以下是必要参数。
-
text_prompt –(必要)用于生成的文本提示数组。每个元素都是一个包含提示和提示权重的JSON对象。
text – 要传递给模型的提示。
最低 最高 0
2000
-
weight –(可选)模型应当应用于提示的权重。小于零的值表示否定提示。否定提示用于告知模型避免某些概念。
weight
的默认值为 1。
-
init_image –(必要)要用于初始化扩散过程的 base64 编码图像。
-
mask_source –(必要)确定掩膜的来源。可能的值有:
-
MASK_ IMAGE _ WHITE — 使用蒙版图像的白色像素
mask_image
作为蒙版。白色像素将被替换,黑色像素保持不变。 -
MASK_ IMAGE _ BLACK — 使用蒙版图像的黑色像素
mask_image
作为蒙版。黑色像素将被替换,白色像素保持不变。 -
INIT_ IMAGE _ ALPHA — 使用中图像的 Alpha 通道
init_image
作为蒙版,完全透明的像素被替换,完全不透明的像素保持不变。
-
-
mask_image –(必要)要用作
init_image
中源图像掩膜的 base64 编码掩膜图像。必须与源图像的尺寸相同。使用mask_source
选项来指定应替换哪些像素。
以下是可选参数。
-
cfg_scale –(可选)确定最终图像对提示的描绘程度。使用较小的数字可提高生成内容的随机性。
默认 最低 最高 7
0
35
-
clip_guidance_preset –(可选)枚举:
FAST_BLUE, FAST_GREEN, NONE, SIMPLE, SLOW, SLOWER, SLOWEST
。 -
sampler –(可选)用于扩散过程的采样器。如果省略此值,模型会自动为您选择合适的采样器。
枚举:
DDIM, DDPM, K_DPMPP_2M, K_DPMPP_2S_ANCESTRAL, K_DPM_2, K_DPM_2_ANCESTRAL, K_EULER, K_EULER_ANCESTRAL, K_HEUN K_LMS
。 -
samples –(可选)要生成的图像数量。目前,Amazon Bedrock 支持生成一个图像。如果为
samples
提供一个值,该值必须为 1。默认 最低 最高 1
1
1
-
seed –(可选)种子决定初始噪声设置。使用与上一次运行时相同的种子和相同的设置,以使推理可以创建相似的图像。如果不设置此值,或者此值为 0,它会被设置为一个随机数字。
默认 最低 最高 0
0
4294967295
-
steps –(可选)生成步骤决定对图像进行采样的次数。步骤越多,结果就越准确。
默认 最低 最高 30
10
50
-
style_preset –(可选)用于将图像模型向特定样式引导的样式预设。此样式预设列表可能会发生变化。
枚举:
3d-model, analog-film, animé, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, neon-punk, origami, photographic, pixel-art, tile-texture
-
extras –(可选)传递给引擎的额外参数。请谨慎使用。这些参数用于开发中或实验性的功能,可能会有变更,恕不另行通知。
-
- Response
-
Stability.ai Diffusion 1.0 模型将返回以下字段,用于进行文本到图像的推理调用。
{ "result": string, "artifacts": [ { "seed": int, "base64": string, "finishReason": string } ] }
result – 操作的结果。如果成功,响应为
success
。-
artifacts – 一个图像数组,每个请求的图像对应一个。
seed – 用于生成图像的种子值。
-
base64 – 模型生成的 base64 编码图像。
-
finishedReason— 图像生成过程的结果。有效值为:
SUCCESS— 图像生成过程成功。
ERROR— 发生了错误。
CONTENT_ FILTERED — 内容过滤器过滤了图像,图像可能会模糊。