Amazon Titan Image Generator G1 模型 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Titan Image Generator G1 模型

Amazon Titan Image Generator G1 是一個圖像生成模型。該模型是從文字產生影像,並允許使用者上傳和編輯現有的影像。該模型可以從自然語言文本生成圖像,也可用於編輯或生成現有圖像或生成的圖像的變化。使用者可以使用文字提示 (不含遮罩) 編輯影像,或使用影像遮罩來編輯部分影像。您可以使用擴圖功能延伸影像的邊界,並使用修圖功能填滿影像。另外,也可以根據選用的文字提示產生影像變體。

Amazon Titan Image Generator G1 模型支持即時定制,允許創作者導入 1 到 5 個參考圖像,並在新穎的環境中生成給定的主題圖像。該模型保留了影像的關鍵特徵,執行基於圖像的風格傳輸而無需迅速進行工程,並從多個參考圖像中產生風格混合,所有這些都無需進行微調。

為了繼續支持負責任地使用 AI 的最佳實踐,Titan Foundation Models 旨在檢測和刪除數據中的有害內容,拒絕用戶輸入中的不當內容,並過濾包含不適當內容(例如仇恨言論,褻瀆和暴力)的模型輸出。泰坦圖像生成器 FM 為所有生成的圖像添加了一個不可見的水印。

您可以使用 Amazon 基岩主控台中的浮水印偵測功能 (預覽) 或呼叫 Amazon 基岩浮水印偵測 API (預覽) 來檢查影像是否包含來自 Titan 影像產生器的浮水印。

如需 Amazon Titan Image Generator G1 快速工程指導方針的詳細資訊,請參閱 Amazon Titan Image Generator G1 快速工程最佳實務

  • 模型 IDamazon.titan-image-generator-v1

  • 最大輸入字元數 — 512 個字元

  • 最大輸入圖像大小-5 MB(僅支持某些特定分辨率)

  • 使用輸入/繪畫的最大圖像大小 — 1,408 x 1,408 像素

  • 使用影像變體的影像大小上限 - 4,096 x 4,096 像素

  • 語言 — 英文

  • 輸出類型 — 影像

  • 支援的影像類型 — JPEG、JPG、PNG

  • 推論類型 — 隨需、佈建的輸送量

  • 支援的使用案例 - 產生影像、編輯影像、影像變體

功能

  • Text-to-image (T2I)生成 — 輸入文本提示並生成新圖像作為輸出。產生的影像會擷取文字提示描述的概念。

  • T2I 模型的微調 — 導入數個影像以捕捉您自己的風格和個人特色,然後微調核心 T2I 模型。微調的模型會產生符合特定使用者風格和個人特色的影像。

  • 影像編輯選項 – 包括修圖、擴圖、產生變體,以及在沒有影像遮罩情況下自動編輯。

  • 修圖 — 使用影像和分割遮罩做為輸入 (來自使用者或模型估計),並重建遮罩中的區域。使用修圖功能來移除遮罩元素,並以背景像素取而代之。

  • 擴圖 — 使用影像和分割遮罩做為輸入 (來自使用者或由模型估算),並產生無縫延伸區域的新像素。將影像延伸至邊界時,使用精確的擴圖功能來保留遮罩影像的像素。使用預設擴圖功能,根據分割設定將遮罩影像的像素延伸至影像邊界。

  • 圖像變化-使用 1 至 5 張圖像和一個可選的提示作為輸入。它生成保留輸入圖像(S)的內容的新圖像,但改變其樣式和背景。

注意

如果您使用微調的模型,則無法使用 API 或模型的上色或外繪功能。

參數

如需 Amazon Titan Image Generator G1 推論參數的相關資訊,請參閱 Amazon Titan Image Generator G1 推論參數。

微調

如需微調 Amazon Titan Image Generator G1 模型的詳細資訊,請參閱下列頁面。

Titan Image Generator G1微調和定價

該模型使用以下示例公式來計算每個工作的總價格:

總價 = 步數 * Batch 大小 * 每張圖片的價格

最小值(auto):

  • 最小步階 (auto)-500

  • 最小批次大小-8

  • 預設學習速率

  • 每張圖片的價格-0.005

微調超參數設定

步驟 — 模型暴露給每個批次的次數。沒有預設的步數設定。您必須選取介於 10-40,000 之間的數字,或選取「自動」的字串值。

步驟設定-自動 — Amazon 基岩會根據訓練資訊決定合理的值。選取此選項可將模型效能優先於訓練成本。步驟數是自動確定的。根據您的資料集而定,此數字通常介於 1,000 到 8,000 之間。Job 成本受到用於將模型公開給資料的步驟數的影響。請參閱定價詳細資料的定價範例一節,以瞭解工作成本的計算方式。(請參閱上面的範例表格,瞭解選取「自動」(Auto) 時,步數與影像數目的關係。)

步驟設定-自訂 — 您可以輸入您希望 Bedrock 將自訂模型公開給訓練資料的步驟數。這個值可以介於 10 到 4 萬之間。您可以使用較低的步數值來降低模型產生的每個影像的成本。

Batch 大小 — 更新模型參數之前處理的樣本數目。這個值介於 8 和 192 之間,而且是 8 的倍數。

學習速率 — 每批訓練資料之後更新模型參數的速率。這是一個介於 0 和 1 之間的浮點值。依預設,學習速率設定為 0.00001。

如需微調程序的詳細資訊,請參閱提交模型自訂工作

輸出

Titan Image Generator G1使用輸出影像的大小和品質來決定影像的定價方式。 Titan Image Generator G1根據大小有兩個定價區段:一個用於 512*512 張影像,另一個用於 1024*1024 張影像。定價是根據影像尺寸高度 * 寬度,小於或等於 512* 512 或大於 512* 512。

如需 Amazon 基岩定價的詳細資訊,請參閱 Amazon 基岩定價。

水印檢測

注意

適用於 Amazon 基岩主控台和 API 的浮水印偵測可在公開預覽版本中使用,而且只會偵測從中產生的浮水印。Titan Image Generator G1此功能目前僅適用於us-west-2us-east-1地區。水印檢測是對由生成的水印的高度準確檢測Titan Image Generator G1。從原始影像修改的影像可能會產生較不準確的偵測結果。

該模型為所有生成的圖像添加了不可見的水印,以減少錯誤信息的傳播,協助保護版權並跟踪內容使用情況。浮水印偵測可協助您確認圖像是否由Titan Image Generator G1模型產生,以檢查此浮水印是否存在。

注意

水印檢測 API 處於預覽狀態,可能會更改。我們建議您建立虛擬環境以使用 SDK。由於最新的 SDK 中無法使用浮水印偵測 API,因此建議您先從虛擬環境中解除安裝最新版本的 SDK,然後再使用浮水印偵測 API 安裝版本。

您可以上傳圖像以檢測圖像上Titan Image Generator G1是否存在水印。按照以下步驟使用控制台偵測此型號的浮水印。

要使用以下命令檢測水印Titan Image Generator G1:
  1. Amazon Bedrock 主控台開啟 Amazon Bedrock 主控台

  2. 從 Amazon 基岩中的導航窗格中選擇概述。選擇構建和測試選項卡。

  3. 在裡面保護部分,轉到水印檢測並選擇查看水印檢測

  4. 選取「上傳圖片」,然後找出 JPG 或 PNG 格式的檔案。允許的最大檔案大小為 5 MB。

  5. 上傳後,將顯示圖像的縮略圖,其中包含名稱,文件大小和上次修改日期。選取 [X] 以刪除或取代 [上傳] 區段中的影像。

  6. 選取「分析」以開始浮水印偵測分析。

  7. 影像會在「結果」(Results) 下預覽,並指出是否偵測到浮水印,且影像下方是否偵測到浮水印,並在影像上顯示橫幅。如果未檢測到水印,則圖像下方的文本將顯示「未檢測到水印」。

  8. 若要載入下一張影像,請在「上傳」區段的影像縮圖中選取 X,然後選擇要分析的新影像。

提示詞工程指導方針

遮罩提示 — 此演算法會將像素歸類為概念。使用者可以提供文字提示,用於根據遮罩提示的解釋對要遮罩的影像區域進行分類。提示選項可以解譯更複雜的提示,並將遮罩編碼為分割演算法。

影像遮罩 — 您也可以使用影像遮罩來設定遮罩值。影像遮罩可與遮罩的提示輸入結合使用,以提高準確度。影像遮罩檔必須符合以下參數:

  • 遮罩影像的遮罩影像值必須是 0 (黑) 或 255 (白)。值為 0 的影像遮罩區域,會以使用者提示和/或輸入影像中的影像重新產生。

  • maskImage 欄位必須是 base64 編碼的影像字串。

  • 遮罩影像必須具有與輸入影像相同的尺寸 (相同的高度和寬度)。

  • 輸入影像和遮罩影像只能使用 PNG 或 JPG 檔案。

  • 遮罩影像只能使用黑白像素值。

  • 遮罩影像只能使用 RGB 色頻 (不支援 Alpha 色頻)。

如需 Amazon Titan Image Generator G1 迅速工程的詳細資訊,請參閱 Amazon Titan Image Generator G1 快速工程最佳實務

如需一般提示詞工程指導方針,請參閱提示詞工程指導方針