Amazon Titan Image Generator G1 模型

Amazon Titan Image Generator G1 是一個圖像生成模型。該模型是從文字產生影像，並允許使用者上傳和編輯現有的影像。該模型可以從自然語言文本生成圖像，也可用於編輯或生成現有圖像或生成的圖像的變化。使用者可以使用文字提示 (不含遮罩) 編輯影像，或使用影像遮罩來編輯部分影像。您可以使用擴圖功能延伸影像的邊界，並使用修圖功能填滿影像。另外，也可以根據選用的文字提示產生影像變體。

Amazon Titan Image Generator G1 模型支持即時定制，允許創作者導入 1 到 5 個參考圖像，並在新穎的環境中生成給定的主題圖像。該模型保留了影像的關鍵特徵，執行基於圖像的風格傳輸而無需迅速進行工程，並從多個參考圖像中產生風格混合，所有這些都無需進行微調。

為了繼續支持負責任地使用 AI 的最佳實踐，Titan Foundation Models 旨在檢測和刪除數據中的有害內容，拒絕用戶輸入中的不當內容，並過濾包含不適當內容（例如仇恨言論，褻瀆和暴力）的模型輸出。泰坦圖像生成器 FM 為所有生成的圖像添加了一個不可見的水印。

您可以使用 Amazon 基岩主控台中的浮水印偵測功能 (預覽) 或呼叫 Amazon 基岩浮水印偵測 API (預覽) 來檢查影像是否包含來自 Titan 影像產生器的浮水印。

如需 Amazon Titan Image Generator G1 快速工程指導方針的詳細資訊，請參閱 Amazon Titan Image Generator G1 快速工程最佳實務。

模型 ID – amazon.titan-image-generator-v1
最大輸入字元數 — 512 個字元
最大輸入圖像大小-5 MB（僅支持某些特定分辨率）
使用輸入/繪畫的最大圖像大小 — 1,408 x 1,408 像素
使用影像變體的影像大小上限 - 4,096 x 4,096 像素
語言 — 英文
輸出類型 — 影像
支援的影像類型 — JPEG、JPG、PNG
推論類型 — 隨需、佈建的輸送量
支援的使用案例 - 產生影像、編輯影像、影像變體

功能

Text-to-image （T2I）生成 — 輸入文本提示並生成新圖像作為輸出。產生的影像會擷取文字提示描述的概念。
T2I 模型的微調 — 導入數個影像以捕捉您自己的風格和個人特色，然後微調核心 T2I 模型。微調的模型會產生符合特定使用者風格和個人特色的影像。
影像編輯選項 – 包括修圖、擴圖、產生變體，以及在沒有影像遮罩情況下自動編輯。
修圖 — 使用影像和分割遮罩做為輸入 (來自使用者或模型估計)，並重建遮罩中的區域。使用修圖功能來移除遮罩元素，並以背景像素取而代之。
擴圖 — 使用影像和分割遮罩做為輸入 (來自使用者或由模型估算)，並產生無縫延伸區域的新像素。將影像延伸至邊界時，使用精確的擴圖功能來保留遮罩影像的像素。使用預設擴圖功能，根據分割設定將遮罩影像的像素延伸至影像邊界。
圖像變化-使用 1 至 5 張圖像和一個可選的提示作為輸入。它生成保留輸入圖像（S）的內容的新圖像，但改變其樣式和背景。

注意

如果您使用微調的模型，則無法使用 API 或模型的上色或外繪功能。

參數

如需 Amazon Titan Image Generator G1 推論參數的相關資訊，請參閱 Amazon Titan Image Generator G1 推論參數。

微調

如需微調 Amazon Titan Image Generator G1 模型的詳細資訊，請參閱下列頁面。

Titan Image Generator G1微調和定價

該模型使用以下示例公式來計算每個工作的總價格：

總價 = 步數 * Batch 大小 * 每張圖片的價格

最小值（auto）：

最小步階 (auto)-500
最小批次大小-8
預設學習速率
每張圖片的價格-0.005

微調超參數設定

步驟 — 模型暴露給每個批次的次數。沒有預設的步數設定。您必須選取介於 10-40,000 之間的數字，或選取「自動」的字串值。

步驟設定-自動 — Amazon 基岩會根據訓練資訊決定合理的值。選取此選項可將模型效能優先於訓練成本。步驟數是自動確定的。根據您的資料集而定，此數字通常介於 1,000 到 8,000 之間。Job 成本受到用於將模型公開給資料的步驟數的影響。請參閱定價詳細資料的定價範例一節，以瞭解工作成本的計算方式。(請參閱上面的範例表格，瞭解選取「自動」(Auto) 時，步數與影像數目的關係。)

步驟設定-自訂 — 您可以輸入您希望 Bedrock 將自訂模型公開給訓練資料的步驟數。這個值可以介於 10 到 4 萬之間。您可以使用較低的步數值來降低模型產生的每個影像的成本。

Batch 大小 — 更新模型參數之前處理的樣本數目。這個值介於 8 和 192 之間，而且是 8 的倍數。

學習速率 — 每批訓練資料之後更新模型參數的速率。這是一個介於 0 和 1 之間的浮點值。依預設，學習速率設定為 0.00001。

如需微調程序的詳細資訊，請參閱提交模型自訂工作。

輸出

Titan Image Generator G1使用輸出影像的大小和品質來決定影像的定價方式。 Titan Image Generator G1根據大小有兩個定價區段：一個用於 512*512 張影像，另一個用於 1024*1024 張影像。定價是根據影像尺寸高度 * 寬度，小於或等於 512* 512 或大於 512* 512。

如需 Amazon 基岩定價的詳細資訊，請參閱 Amazon 基岩定價。

水印檢測

注意

適用於 Amazon 基岩主控台和 API 的浮水印偵測可在公開預覽版本中使用，而且只會偵測從中產生的浮水印。Titan Image Generator G1此功能目前僅適用於us-west-2和us-east-1地區。水印檢測是對由生成的水印的高度準確檢測Titan Image Generator G1。從原始影像修改的影像可能會產生較不準確的偵測結果。

該模型為所有生成的圖像添加了不可見的水印，以減少錯誤信息的傳播，協助保護版權並跟踪內容使用情況。浮水印偵測可協助您確認圖像是否由Titan Image Generator G1模型產生，以檢查此浮水印是否存在。

注意

水印檢測 API 處於預覽狀態，可能會更改。我們建議您建立虛擬環境以使用 SDK。由於最新的 SDK 中無法使用浮水印偵測 API，因此建議您先從虛擬環境中解除安裝最新版本的 SDK，然後再使用浮水印偵測 API 安裝版本。

您可以上傳圖像以檢測圖像上Titan Image Generator G1是否存在水印。按照以下步驟使用控制台偵測此型號的浮水印。

要使用以下命令檢測水印Titan Image Generator G1：

在 Amazon Bedrock 主控台開啟 Amazon Bedrock 主控台
從 Amazon 基岩中的導航窗格中選擇概述。選擇構建和測試選項卡。
在裡面保護部分，轉到水印檢測並選擇查看水印檢測。
選取「上傳圖片」，然後找出 JPG 或 PNG 格式的檔案。允許的最大檔案大小為 5 MB。
上傳後，將顯示圖像的縮略圖，其中包含名稱，文件大小和上次修改日期。選取 [X] 以刪除或取代 [上傳] 區段中的影像。
選取「分析」以開始浮水印偵測分析。
影像會在「結果」(Results) 下預覽，並指出是否偵測到浮水印，且影像下方是否偵測到浮水印，並在影像上顯示橫幅。如果未檢測到水印，則圖像下方的文本將顯示「未檢測到水印」。
若要載入下一張影像，請在「上傳」區段的影像縮圖中選取 X，然後選擇要分析的新影像。

提示詞工程指導方針

遮罩提示 — 此演算法會將像素歸類為概念。使用者可以提供文字提示，用於根據遮罩提示的解釋對要遮罩的影像區域進行分類。提示選項可以解譯更複雜的提示，並將遮罩編碼為分割演算法。

影像遮罩 — 您也可以使用影像遮罩來設定遮罩值。影像遮罩可與遮罩的提示輸入結合使用，以提高準確度。影像遮罩檔必須符合以下參數：

遮罩影像的遮罩影像值必須是 0 (黑) 或 255 (白)。值為 0 的影像遮罩區域，會以使用者提示和/或輸入影像中的影像重新產生。
maskImage 欄位必須是 base64 編碼的影像字串。
遮罩影像必須具有與輸入影像相同的尺寸 (相同的高度和寬度)。
輸入影像和遮罩影像只能使用 PNG 或 JPG 檔案。
遮罩影像只能使用黑白像素值。
遮罩影像只能使用 RGB 色頻 (不支援 Alpha 色頻)。

如需 Amazon Titan Image Generator G1 迅速工程的詳細資訊，請參閱 Amazon Titan Image Generator G1 快速工程最佳實務。

如需一般提示詞工程指導方針，請參閱提示詞工程指導方針。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

Amazon Titan Multimodal Embeddings G1

Amazon 基岩工作室