Amazon Titan Image Generator G1モデル - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Titan Image Generator G1モデル

Amazon Titan Image Generator G1は画像生成モデルです。テキストから画像を生成することや、ユーザーが既存の画像をアップロードして編集することが可能です。ユーザーは、テキストプロンプトを使って (マスクなしで) 画像を編集したり、画像マスクを使って画像の一部を編集したりできます。アウトペインティングで画像の境界を拡張し、インペインティングで画像を塗りつぶすことができます。また、オプションのテキストプロンプトに基づいて画像のバリエーションを生成することもできます。Amazon Titan Image Generator G1 Generator には、出力ファイルにウォーターマークが含まれています。

注記

Amazon Titan Image Generator G1 は現在プレビューリリース中です。本番環境での作業にはお勧めしません。一部の機能は期待どおりに動作しない場合があります。イメージと出力データは、正確な結果よりも少ない結果を生成する可能性があります。

Amazon Titan Image Generator G1プロンプトエンジニアリングガイドラインの詳細については、「Amazon Titan Image Generator G1 Prompt Engineering Best Practices」を参照してください。

  • モデル IDamazon.titan-image-generator-v1

  • 最大入力文字数 – 1,024 文字

  • 最大入力画像サイズ – 50 MB (一部の特定の解像度のみ対応)

  • イン/アウトペインティングを使用する場合の最大画像サイズ – 1,024 x 1,024 ピクセル

  • 画像バリエーションを使用する場合の最大画像サイズ – 4,096 x 4,096 ピクセル

  • 言語 – 英語

  • 出力タイプ – 画像

  • サポートされている画像タイプ – JPEG、JPG、PNG

  • 推論タイプ – オンデマンド、プロビジョンドスループット

  • サポートされているユースケース – 画像生成、画像編集、画像バリエーション

機能

  • T ext-to-image (T2I) 生成 — テキストプロンプトを入力し、出力として新しいイメージを生成します。生成された画像には、テキストプロンプトで説明されている概念が取り込まれています。

  • T2I モデルのファインチューニング – 複数の画像をインポートして独自のスタイルやパーソナライゼーションを取り込み、核となる T2I モデルをファインチューニングします。ファインチューニングされたモデルでは、特定のユーザーのスタイルやパーソナライゼーションに合わせた画像が生成されます。

  • 画像編集オプション – インペインティング、アウトペインティング、バリエーションの生成、画像マスクなしの自動編集などがあります。

  • インペインティング – 画像とセグメンテーションマスクを入力 (ユーザーからの入力またはモデルによって推定された入力) として使用し、マスク内の領域を再構成します。インペインティングを使用して、マスクされている要素を削除し、背景ピクセルに置き換えることができます。

  • アウトペインティング – 画像とセグメンテーションマスクを入力 (ユーザーからの入力またはモデルによって推定された入力) として使用し、領域をシームレスに拡張する新しいピクセルを生成します。正確なアウトペインティングを使用すると、画像を境界まで拡張するときにマスクされた画像のピクセルが維持されます。デフォルトのアウトペイントを使用すると、セグメンテーション設定に基づいてマスクされた画像のピクセルが画像の境界まで拡張されます。

  • 画像バリエーション – 画像とオプションのプロンプトを入力として使用します。入力画像の内容はそのままに、スタイルや背景を変えて新しい画像を生成します。

注記

微調整されたモデルを使用している場合、API またはモデルのインペインティングまたはアウトペインティング機能は使用できません。

パラメータ

Amazon Titan Image Generator G1推論パラメータの詳細については、「Amazon Titan Image Generator G1 推論パラメータ」を参照してください。

ファインチューニング

Amazon Titan Image Generator G1モデルの微調整の詳細については、以下のページを参照してください。

Titan Image Generator G1 の微調整と料金

このモデルでは、次の式例を使用して、ジョブあたりの総価格を計算します。

合計料金 = ステップ * バッチサイズ * 表示されたイメージあたりの料金

最小値 (自動):

  • 最小ステップ (自動) - 500

  • 最小バッチサイズ - 8

  • デフォルトの学習レート - 0.0001

  • 表示されたイメージあたりの料金 - 0.005

ハイパーパラメータ設定の微調整

ステップ - モデルが各バッチに公開される回数。デフォルトのステップカウントは設定されていません。10~40,000 の数値、または「Auto」の文字列値を選択する必要があります。

ステップ設定 - 自動 - Amazon Bedrock は、トレーニング情報に基づいて妥当な値を決定します。このオプションを選択すると、トレーニングコストよりもモデルのパフォーマンスが優先されます。ステップの数は自動的に決定されます。この数は通常、データセットに基づいて 1,000~8,000 です。ジョブのコストは、モデルをデータに公開するために使用されるステップの数によって影響を受けます。ジョブのコストの計算方法については、料金詳細の料金例のセクションを参照してください。(Auto が選択されているときのステップ数とイメージ数との関連については、上記の例の表を参照してください。)

ステップ設定 - カスタム - Bedrock でカスタムモデルをトレーニングデータに公開するステップ数を入力できます。この値は 10~40,000 です。低いステップカウント値を使用することで、モデルが生成するイメージごとのコストを削減できます。

バッチサイズ – モデルパラメータが更新される前に処理されたサンプルの数。この値は 8~192 で、8 の倍数です。

学習レート — トレーニングデータの各バッチ後にモデルパラメータが更新されるレート。これは 0~1 の浮動小数点値です。学習レートはデフォルトで 0.0001 に設定されています。

微調整手順の詳細については、「モデルカスタマイズジョブの送信」を参照してください。

出力

Titan Image Generator G1 は、出力イメージのサイズと品質を使用して、イメージの価格を決定します。 Titan Image Generator G1には、サイズに基づいて 2 つの料金セグメントがあります。1 つは 512 x 512 個のイメージ用、もう 1 つは 1024 x 1024 個のイメージ用です。料金は、画像サイズ (高さ x 幅) が 512 x 512 以下か 512 x 512 より大きいかによって決まります。

Amazon Bedrock の料金の詳細については、「Amazon Bedrock の料金」を参照してください。

ウォーターマーク検出

注記

透かし検出はパブリックプレビューリリースであり、 から生成された透かしのみを検出しますTitan Image Generator G1。この機能は現在、PDX および IAD リージョンでのみ使用できます。透かし検出は、 によって生成された透かしを非常に正確に検出しますTitan Image Generator G1。元のイメージから変更されたイメージは、精度の低い検出結果を生成する可能性があります。

このモデルでは、生成されたすべてのイメージに不可視ウォーターマークを追加して、誤った情報の拡散を減らし、著作権保護を支援し、コンテンツの使用状況を追跡します。将来的には、ウォーターマーク検出 API を使用して、イメージがTitan Image Generator G1モデルによって生成されたかどうかを確認できます。これにより、このウォーターマークの存在を確認できます。

イメージをアップロードして、イメージに からのウォーターマークTitan Image Generator G1が存在するかどうかを検出できます。コンソールを使用して、次のステップに従って、このモデルから透かしを検出します。

で透かしを検出するにはTitan Image Generator G1:
  1. Amazon Bedrock コンソール」をクリックして、 Amazon Bedrock コンソールを開きます。

  2. Amazon Bedrock のナビゲーションペインから概要を選択します。構築とテスト タブを選択します。

  3. 「保護」セクションで「ウォーターマーク検出」に移動し、「ウォーターマーク検出を表示」を選択します。

  4. イメージのアップロードを選択し、JPG または PNG 形式のファイルを見つけます。最大ファイルサイズは 5 MB です。

  5. アップロードすると、名前、ファイルサイズ、最終変更日を含む画像のサムネイルが表示されます。X を選択して、アップロードセクションからイメージを削除または置き換えます。

  6. 分析を選択して、透かし検出分析を開始します。

  7. イメージは結果 でプレビューされ、イメージの下にウォーターマークが検出され、イメージ全体にバナーが検出されたウォーターマークが検出されるかどうかを示します。透かしが検出されない場合、イメージの下のテキストには「透かしが検出されませんでした」と表示されます。

  8. 次のイメージをロードするには、アップロードセクションでイメージのサムネイルの X を選択し、分析する新しいイメージを選択します。

プロンプトエンジニアリングガイドライン

マスクプロンプト – このアルゴリズムはピクセルをコンセプトに分類します。マスクする画像の領域をマスクプロンプトの解釈に基づいて分類するためのテキストプロンプトを、ユーザーが入力できます。プロンプトオプションを使うと、より複雑なプロンプトを解釈して、マスクをセグメンテーションアルゴリズムにエンコードできます。

画像マスク – 画像マスクを使用してマスク値を設定することもできます。画像マスクをマスクのプロンプト入力と組み合わせると、正解率が向上します。画像マスクファイルは、以下のパラメータに準拠している必要があります。

  • マスク画像の値は 0 (黒) または 255 (白) でなければなりません。値が 0 の画像マスク領域は、ユーザープロンプトによる画像または入力画像で再生成されます。

  • maskImage フィールドは Base64 でエンコードされた画像文字列である必要があります。

  • マスク画像は、入力画像と同じ寸法 (高さと幅が同じ) である必要があります。

  • 入力画像とマスク画像には PNG または JPG ファイルのみを使用できます。

  • マスク画像には白黒のピクセル値のみを使用する必要があります。

  • マスク画像では RGB チャネルのみを使用できます (アルファチャネルはサポートされていません)。

Amazon Titan Image Generator G1プロンプトエンジニアリングの詳細については、「Amazon Titan Image Generator G1 Prompt Engineering Best Practices」を参照してください。

一般的なプロンプトエンジニアリングガイドラインについては、「プロンプトエンジニアリングガイドライン」を参照してください。