本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Stability.ai Diffusion 1.0 影像至影像 (遮罩)
Stability.ai Diffusion 1.0 模型具有下列推論參數和模型回應,用於在影像到影像推論呼叫中使用遮罩。
請求與回應
要求主體會在要求body
欄位中傳遞給InvokeModel或InvokeModelWithResponseStream。
如需詳細資訊,請參閱 https://platform.stability.ai/docs/api-reference#tag/v1generation/operation/masking
- Request
-
Stability.ai Diffusion 1.0 模型具有下列推論參數,用於影像到影像 (遮罩) 推論呼叫。
{ "text_prompts": [ { "text": string, "weight": float } ], "init_image" : string , "mask_source" : string, "mask_image" : string, "cfg_scale": float, "clip_guidance_preset": string, "sampler": string, "samples" : int, "seed": int, "steps": int, "style_preset": string, "extras" : json object }
下列是必要的參數。
-
text_prompt — (必要) 用於生成的文字提示陣列。每個元素都是包含提示和權值的JSON物件。
text — 您要傳遞至模型的提示。
下限 最大 0
2000
-
weight — (選用) 模型應套用至提示的權重。小於零的值會宣告負數提示。使用否定提示,告告模型避免某些概念。
weight
的預設值為一。
-
init_image — (必要) 您要用來初始化擴散程序的 base64 編碼影像。
-
mask_source — (必要) 決定從何處取得遮罩。可能值為:
-
MASK_ IMAGE _ WHITE — 使用中遮色片影像的白色像素
mask_image
做為遮色片。白色像素會被取代,黑色像素則保持不變。 -
MASK_ IMAGE _ BLACK — 使用中遮色片影像的黑色像素
mask_image
做為遮色片。黑色像素會被取代,白色像素則保持不變。 -
INIT_ IMAGE _ ALPHA — 使用中的圖像的 alpha 通道
init_image
作為蒙版,完全透明像素被替換,完全不透明的像素保持不變。
-
-
mask_image — (必要) 您要用作
init_image
中來源影像遮罩的 base64 編碼遮罩影像。必須與來源影像的尺寸相同。使用mask_source
選項指定應取代哪些像素。
以下是選用參數。
-
cfg_scale — (選用) 決定最終影像描繪提示的程度。使用較低的數字來增加產生的隨機性。
預設 下限 最大 7
0
35
-
clip_guidance_preset - (選用) 列舉:
FAST_BLUE, FAST_GREEN, NONE, SIMPLE, SLOW, SLOWER, SLOWEST
。 -
sampler — (選用) 用於擴散處理的取樣器。如果省略此值,模型會自動為您選取適當的取樣器。
列舉:
DDIM, DDPM, K_DPMPP_2M, K_DPMPP_2S_ANCESTRAL, K_DPM_2, K_DPM_2_ANCESTRAL, K_EULER, K_EULER_ANCESTRAL, K_HEUN K_LMS
。 -
sample — (選用) 要產生的影像數目。目前 Amazon Bedrock 支援產生一個影像。如果您提供
samples
的值,則該值必須為一。產生
預設 下限 最大 1
1
1
-
seed – (選用) seed 決定初始雜訊設定。使用與先前執行相同的種子和相同的設定,以允許推論建立相似的影像。如果您未設定此值,或值為 0,便會設定為隨機數。
預設 下限 最大 0
0
4294967295
-
steps – (選用) 產生步驟會決定影像取樣的次數。步驟越多,結果會更準確。
預設 下限 最大 30
10
50
-
style_preset — (選用) 將影像模型引導至特定樣式的樣式預設集。此樣式預設集清單會隨時變更。
列舉:
3d-model, analog-film, animé, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, neon-punk, origami, photographic, pixel-art, tile-texture
-
extras - (選用) 傳遞給引擎的額外參數。請謹慎使用。這些參數用於開發或實驗功能,並且可能隨時變更,恕不另行通知。
-
- Response
-
Stability.ai Diffusion 1.0 模型會傳回以下用於文字轉影像推斷呼叫的欄位。
{ "result": string, "artifacts": [ { "seed": int, "base64": string, "finishReason": string } ] }
result — 操作的結果。如果成功,回應為
success
。-
artifacts — 影像陣列,每個請求影像一個。
seed — 用於產生影像的種子值。
-
base64 — 模型產生的 Base64 編碼影像。
-
finishedReason— 影像產生程序的結果。有效的 值如下:
SUCCESS— 影像產生程序成功。
ERROR— 發生錯誤。
CONTENT_ FILTERED — 內容過濾器過濾了圖像,並且圖像可能會模糊。