Stability.ai Diffusion 1.0 影像至影像 (遮罩) - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Stability.ai Diffusion 1.0 影像至影像 (遮罩)

Stability.ai Diffusion 1.0 模型具有下列推論參數和模型回應,用於在影像到影像推論呼叫中使用遮罩。

請求與回應

要求主體會在要求body欄位中傳遞給InvokeModelInvokeModelWithResponseStream

如需詳細資訊,請參閱 https://platform.stability.ai/docs/api-reference#tag/v1generation/operation/masking

Request

Stability.ai Diffusion 1.0 模型具有下列推論參數,用於影像到影像 (遮罩) 推論呼叫。

{ "text_prompts": [ { "text": string, "weight": float } ], "init_image" : string , "mask_source" : string, "mask_image" : string, "cfg_scale": float, "clip_guidance_preset": string, "sampler": string, "samples" : int, "seed": int, "steps": int, "style_preset": string, "extras" : json object }

下列是必要的參數。

  • text_prompt — (必要) 用於生成的文字提示陣列。每個元素都是包含提示和權值的JSON物件。

    • text — 您要傳遞至模型的提示。

      下限 最大

      0

      2000

    • weight — (選用) 模型應套用至提示的權重。小於零的值會宣告負數提示。使用否定提示,告告模型避免某些概念。weight 的預設值為一。

  • init_image — (必要) 您要用來初始化擴散程序的 base64 編碼影像。

  • mask_source — (必要) 決定從何處取得遮罩。可能值為:

    • MASK_ IMAGE _ WHITE — 使用中遮色片影像的白色像素mask_image做為遮色片。白色像素會被取代,黑色像素則保持不變。

    • MASK_ IMAGE _ BLACK — 使用中遮色片影像的黑色像素mask_image做為遮色片。黑色像素會被取代,白色像素則保持不變。

    • INIT_ IMAGE _ ALPHA — 使用中的圖像的 alpha 通道init_image作為蒙版,完全透明像素被替換,完全不透明的像素保持不變。

  • mask_image — (必要) 您要用作 init_image 中來源影像遮罩的 base64 編碼遮罩影像。必須與來源影像的尺寸相同。使用 mask_source 選項指定應取代哪些像素。

以下是選用參數。

  • cfg_scale — (選用) 決定最終影像描繪提示的程度。使用較低的數字來增加產生的隨機性。

    預設 下限 最大

    7

    0

    35

  • clip_guidance_preset - (選用) 列舉:FAST_BLUE, FAST_GREEN, NONE, SIMPLE, SLOW, SLOWER, SLOWEST

  • sampler — (選用) 用於擴散處理的取樣器。如果省略此值,模型會自動為您選取適當的取樣器。

    列舉:DDIM, DDPM, K_DPMPP_2M, K_DPMPP_2S_ANCESTRAL, K_DPM_2, K_DPM_2_ANCESTRAL, K_EULER, K_EULER_ANCESTRAL, K_HEUN K_LMS

  • sample — (選用) 要產生的影像數目。目前 Amazon Bedrock 支援產生一個影像。如果您提供 samples 的值,則該值必須為一。 產生

    預設 下限 最大

    1

    1

    1

  • seed – (選用) seed 決定初始雜訊設定。使用與先前執行相同的種子和相同的設定,以允許推論建立相似的影像。如果您未設定此值,或值為 0,便會設定為隨機數。

    預設 下限 最大

    0

    0

    4294967295

  • steps – (選用) 產生步驟會決定影像取樣的次數。步驟越多,結果會更準確。

    預設 下限 最大

    30

    10

    50

  • style_preset — (選用) 將影像模型引導至特定樣式的樣式預設集。此樣式預設集清單會隨時變更。

    列舉:3d-model, analog-film, animé, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, neon-punk, origami, photographic, pixel-art, tile-texture

  • extras - (選用) 傳遞給引擎的額外參數。請謹慎使用。這些參數用於開發或實驗功能,並且可能隨時變更,恕不另行通知。

Response

Stability.ai Diffusion 1.0 模型會傳回以下用於文字轉影像推斷呼叫的欄位。

{ "result": string, "artifacts": [ { "seed": int, "base64": string, "finishReason": string } ] }
  • result — 操作的結果。如果成功,回應為 success

  • artifacts — 影像陣列,每個請求影像一個。

    • seed — 用於產生影像的種子值。

    • base64 — 模型產生的 Base64 編碼影像。

    • finishedReason— 影像產生程序的結果。有效的 值如下:

      • SUCCESS— 影像產生程序成功。

      • ERROR— 發生錯誤。

      • CONTENT_ FILTERED — 內容過濾器過濾了圖像,並且圖像可能會模糊。