Amazon Bedrock のクォータ - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Bedrock のクォータ

には、 ごとに、以前 AWS アカウント は制限と呼ばれていたデフォルトのクォータがあります AWS のサービス。特に明記されていない限り、各クォータは 内でリージョン固有です AWS アカウント。一部のクォータは調整可能です。次のリストでは、次の表のService Quotas」列の意味について説明します。

  • クォータが「はい」とマークされている場合はService Quotas ユーザーガイド」の「クォータ引き上げのリクエスト」の手順に従って調整できます。

  • クォータが「いいえ」とマークされている場合、次のいずれかの方法でクォータの引き上げをリクエストできる場合があります。

    • オンデマンドランタイムクォータ のクォータ引き上げをリクエストするには、 AWS アカウント マネージャーにお問い合わせください。 AWS アカウント マネージャーがない場合は、現時点ではクォータを増やすことはできません。

    • 他のクォータの引き上げをリクエストするには、制限引き上げフォームを使用してリクエストを送信し、引き上げを検討します。

    注記

    圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様には優先順位が付けられます。この条件を満たさない場合、リクエストが拒否される場合があります。

一部のクォータはモデルによって異なります。特に明記されていない限り、クォータはモデルのすべてのバージョンに適用されます。

トピックを選択すると、そのクォータの詳細が表示されます。

ランタイムクォータ

レイテンシーはモデルによって異なり、次の条件に直接比例します。

  • 入力トークンと出力トークンの数

  • その時点でのすべての顧客による継続的なオンデマンドリクエストの合計数。

モデル推論を実行するときは、以下のクォータが適用されます。これらのクォータは、 InvokeModelおよび InvokeModelWithResponseStreamリクエストの合計を考慮します。

スループットを高めるには、 を購入しますAmazon Bedrock のプロビジョンドスループット

注記

クォータが Service Quotas で調整できないとマークされている場合は、 AWS アカウント マネージャーに連絡してクォータの引き上げをリクエストできます。 AWS アカウント マネージャーがない場合は、現時点ではクォータを増やすことはできません。圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様には優先順位が付けられます。この条件を満たさない場合、リクエストが拒否される場合があります。

モデル 1 分あたりに処理されるリクエスト数 1 分あたりに処理されるトークン数 Service Quotas で調整可能 (上の表の注を参照)
AI21 Labs Jurassic-2 Mid 400 300,000 いいえ
AI21 Labs Jurassic-2 Ultra 100 300,000 いいえ
Amazon Titan Embeddings G1 - Text 2,000 300,000 いいえ
Amazon Titan Image Generator G1 60 該当なし いいえ
Amazon Titan Multimodal Embeddings G1 2,000 300,000 いいえ
Amazon Titan Text G1 - Express 400 300,000 いいえ
Amazon Titan Text G1 - Lite 800 300,000 いいえ
Amazon Titan Text プレミアム 100 300,000 いいえ
Anthropic Claude Instant 1,000 1,000,000 いいえ
Anthropic Claude 2.x 500 500,000 いいえ
Anthropic Claude 3 Sonnet 500 1,000,000 いいえ
Anthropic Claude 3 Haiku 1,000 2,000,000 いいえ
Anthropic Claude 3 Opus 50 400,000 いいえ
Cohere Command R 400 300,000 いいえ
Cohere Command R+ 400 300,000 いいえ
Cohere Command 400 300,000 いいえ
Cohere Command Light 800 300,000 いいえ
Cohere Embed (英語) 2,000 300,000 いいえ
Cohere Embed (多言語) 2,000 300,000 いいえ
Meta Llama 2 13B 800 300,000 いいえ
Meta Llama 2 70B 400 300,000 いいえ
Meta Llama 3 8b Instruct 800 300,000 いいえ
Meta Llama 3 70b Instruct 400 300,000 いいえ
Mistral AI Mistral 7B Instruct 800 300,000 いいえ
Mistral AI Mistral Large 400 300,000 いいえ
Mistral AI Mixtral 8X7B Instruct 400 300,000 いいえ
Stable Diffusion XL 60 該当なし いいえ

タブを選択すると、モデル固有の推論クォータが表示されます。

Amazon タイタン Text models
説明 Service Quotas で調整可能 (上の表の注を参照)
テキストプロンプトの長さ、文字単位 42,000 いいえ
Amazon Titan Image Generator G1
説明 Service Quotas で調整可能 (上の表の注を参照)
テキストプロンプトの長さ、文字単位 1,024 いいえ
入力イメージサイズ 5 MB いいえ
入力イメージの高さをピクセル単位で (インペインティング/アウトペインティング) 1,024 いいえ
入力イメージの幅 (インペインティング/アウトペインティング) 1,024 いいえ
入力イメージの高さをピクセル単位で (イメージバリエーション) 4,096 いいえ
入力画像の幅をピクセル単位で (画像バリエーション) 4,096 いいえ
入力イメージの合計ピクセル 12,582,912 いいえ
Amazon Titan Embeddings G1 - Text
説明 Service Quotas で調整可能 (上の表の注を参照)
文字単位のテキスト入力の長さ 50,000 いいえ
Amazon Titan Multimodal Embeddings G1
説明 Service Quotas で調整可能 (上の表の注を参照)
文字単位のテキスト入力の長さ 100,000 いいえ
Base64-encodedイメージの文字列、文字単位 25,000,000 いいえ

バッチ推論クォータ

バッチ推論を実行するときは、以下のクォータが適用されます。クォータは入出力データのモダリティによって異なります。

注記

クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォームを使用してリクエストを送信し、引き上げを検討できます。

モダリティ 最小ファイルサイズ 最大ファイルサイズ Service Quotas で調整可能 (上の表の注を参照)
テキストから埋め込みへ 75 MB 500 MB いいえ
テキストからテキストへ 20 MB 150 MB いいえ
テキスト/画像から画像へ 1 MB 50 MB いいえ

ナレッジベースのクォータ

Amazon Bedrock のナレッジベースには、次のクォータが適用されます。

注記

クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォームを使用してリクエストを送信し、引き上げを検討できます。

説明 最大値 Service Quotas で調整可能 (上の表の注を参照) 説明
アカウントあたりのナレッジベース 100 いいえ アカウントあたりのナレッジベースの最大数。
ナレッジベースあたりのデータソース 5 いいえ ナレッジベースあたりのデータソースの最大数。
データソースのチャンクサイズ (Titanテキスト G1 - 埋め込み) 8,192 いいえ を使用したデータソースの最大サイズ (KB)Titan Embeddings G1 - Text。
データソースチャンクサイズ (CohereEmbed英語) 512 いいえ Cohere Embed 英語を使用したデータソースの最大サイズ (KB)。
データソースチャンクサイズ (CohereEmbed多言語) 512 いいえ Cohere Embed 多言語を使用したデータソースの最大サイズ (KB)。
取り込みジョブごとに追加または更新するファイル 5,000,000 いいえ 取り込みジョブごとに取り込むことができる新規および更新されたファイルの最大数。
取り込みジョブごとに削除するファイル 5,000,000 いいえ 取り込みジョブごとに削除できるファイルの最大数。
取り込みジョブファイルサイズ (ソースドキュメント) 50 MB いいえ 取り込みジョブのソースドキュメントファイルの最大サイズ (MB)。
取り込みジョブファイルのサイズ (メタデータファイル) 10 KB いいえ 取り込みジョブ内のメタデータファイルの最大サイズ (KB)。
取り込みジョブのサイズ 100 GB いいえ 取り込みジョブの最大サイズ (GB 単位)。
データソースあたりの同時取り込みジョブ 1 いいえ データソースに対して同時に実行できる取り込みジョブの最大数。
ナレッジベースあたりの同時取り込みジョブ 1 いいえ ナレッジベースで同時に実行できる取り込みジョブの最大数。
アカウントあたりの同時取り込みジョブ 5 いいえ アカウントで同時に実行できる取り込みジョブの最大数。
ユーザークエリサイズ 1,000 いいえ ユーザークエリの最大サイズ (文字単位)。

Amazon Bedrock 関連の API リクエストのナレッジベースには、次のスロットリング制限が適用されます。

API オペレーション 1 秒あたりの最大リクエスト数 Service Quotas で調整可能 (上の表の注を参照)
Retrieve 5 いいえ
RetrieveAndGenerate 5 いいえ
ListKnowledgeBases 10 いいえ
GetKnowledgeBase 10 いいえ
DeleteKnowledgeBase 2 いいえ
UpdateKnowledgeBase 2 いいえ
CreateKnowledgeBase 2 いいえ
ListIngestionJobs 10 いいえ
StartIngestionJob 0.1 いいえ
GetIngestionJob 10 いいえ
ListDataSources 10 いいえ
GetDataSource 10 いいえ
DeleteDataSource 2 いいえ
UpdateDataSource 2 いいえ
CreateDataSource 2 いいえ

エージェントクォータ

Agents for Amazon Bedrock には、次のクォータが適用されます。

注記

クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォームを使用してリクエストを送信し、引き上げを検討できます。

クォータ 最大値 Service Quotas で調整可能 (上の表の注を参照) 説明
アカウントあたりのエージェント 50 はい 1 つのアカウント内のエージェントの最大数。
エージェントあたりの関連付けられたエイリアス 10 いいえ エージェントに関連付けることができるエイリアスの最大数。
エージェント指示書の文字 4,000 はい エージェントの指示の最大文字数。
エージェントあたりのアクショングループ 20 はい エージェントに追加できるアクショングループの最大数。
エージェントごとに有効になっているアクショングループ 11 はい エージェントで有効にできるアクショングループの最大数。
エージェントあたりの APIs または関数 11 はい エージェントに追加できる APIs の最大数。
関数あたりのパラメータ 5 いいえ アクショングループの関数に追加できるパラメータの最大数。
Lambda レスポンスペイロードサイズ 25 KB いいえ アクショングループ Lambda レスポンスのペイロードの最大サイズ。
エージェントあたりの関連付けられたナレッジベース 2 はい エージェントに関連付けることができるナレッジベースの最大数。

次のスロットリング制限は、Amazon Bedrock 関連の API リクエストの エージェントに適用されます。

API オペレーション 1 秒あたりの最大リクエスト数 Service Quotas で調整可能 (上の表の注を参照)
AssociateAgentKnowledgeBase 6 いいえ
CreateAgent 6 いいえ
CreateAgentActionGroup 12 いいえ
CreateAgentAlias 2 いいえ
DeleteAgent 2 いいえ
DeleteAgentActionGroup 2 いいえ
DeleteAgentAlias 2 いいえ
DeleteAgentVersion 2 いいえ
DisassociateAgentKnowledgeBase 4 いいえ
GetAgent 15 いいえ
GetAgentActionGroup 20 いいえ
GetAgentAlias 10 いいえ
GetAgentKnowledgeBase 15 いいえ
GetAgentVersion 10 いいえ
ListAgents 10 いいえ
ListAgentActionGroups 10 いいえ
ListAgentAliases 10 いいえ
ListAgentKnowledgeBases 10 いいえ
ListAgentVersions 10 いいえ
PrepareAgent 2 いいえ
UpdateAgent 4 いいえ
UpdateAgentActionGroup 6 いいえ
UpdateAgentAlias 2 いいえ
UpdateAgentKnowledgeBase 4 いいえ

モデルカスタマイズのクォータ

モデルカスタマイズには、次のクォータが適用されます。

注記

クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォームを使用してリクエストを送信し、引き上げを検討できます。

説明 最大値 Service Quotas で調整可能 (上の表の注を参照)
アカウントでインポートされたモデルの最大数。 0 はい
スケジュールされたカスタマイズジョブの最大数。 2 いいえ
アカウント内のカスタムモデルの最大数。 100 はい

ハイパーパラメータクォータを確認するには、「」を参照してくださいカスタムモデルのハイパーパラメータ

タブを選択すると、さまざまな基盤モデルのカスタマイズに使用されるトレーニングデータセットと検証データセットに適用されるモデル固有のクォータが表示されます。

注記

クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォームを使用してリクエストを送信し、引き上げを検討できます。

Amazon Titan Text Premier
説明 最大 (継続的な事前トレーニング) 使用できません 最大 (ファインチューニング) プレビューのみ Service Quotas で調整可能 (上の表の注を参照)
バッチサイズが 1 の場合の入力トークンと出力トークンの合計 該当なし 4,096 いいえ
バッチサイズが 2、3、または 4 の場合の入力トークンと出力トークンの合計 該当なし 該当なし いいえ
データセット内のサンプルあたりの文字数クォータ 該当なし トークンクォータ x 6 いいえ
トレーニングレコードと検証レコードの合計 該当なし 20,000 はい
トレーニングデータセットのファイルサイズ 該当なし 1 GB いいえ
検証データセットのファイルサイズ 該当なし 100 MB いいえ
Amazon Titan Text G1 - Express
説明 最大 (継続的な事前トレーニング) 最大 (ファインチューニング) Service Quotas で調整可能 (上の表の注を参照)
バッチサイズが 1 の場合の入力トークンと出力トークンの合計 4,096 4,096 いいえ
バッチサイズが 2、3、または 4 の場合の入力トークンと出力トークンの合計 2,048 2,048 いいえ
データセット内のサンプルあたりの文字数クォータ トークンクォータ x 6 トークンクォータ x 6 いいえ
トレーニングレコードと検証レコードの合計 100,000 10,000 はい
トレーニングデータセットのファイルサイズ 10 GB 1 GB いいえ
検証データセットのファイルサイズ 100 MB 100 MB いいえ
Amazon Titan Text G1 - Lite
説明 最大 (継続的な事前トレーニング) 最大 (ファインチューニング) Service Quotas で調整可能 (上の表の注を参照)
バッチサイズが 1 または 2 の場合の入力トークンと出力トークンの合計 4,096 4,096 いいえ
バッチサイズが 3、4、5、または 6 の場合の入力トークンと出力トークンの合計 2,048 2,048 いいえ
データセット内のサンプルあたりの文字数クォータ トークンクォータ x 6 トークンクォータ x 6 いいえ
トレーニングレコードと検証レコードの合計 100,000 10,000 はい
トレーニングデータセットのファイルサイズ 10 GB 1 GB いいえ
検証データセットのファイルサイズ 100 MB 100 MB いいえ
Amazon Titan Image Generator G1
説明 最小 (微調整) 最大 (ファインチューニング) Service Quotas で調整可能 (上の表の注を参照)
トレーニングサンプルのテキストプロンプトの長さ、文字単位 3 1,024 いいえ
トレーニングデータセット内のレコード 5 10,000 いいえ
入力イメージサイズ 0 50 MB いいえ
入力イメージの高さをピクセル単位で表示 512 4,096 いいえ
入力イメージの幅をピクセル単位で表示 512 4,096 いいえ
入力イメージの合計ピクセル 0 12,582,912 いいえ
入力イメージのアスペクト比 1:4 4:1 いいえ
トレーニングレコードと検証レコードの合計 該当なし 10,000 はい
Amazon Titan Multimodal Embeddings G1
説明 最小 (微調整) 最大 (ファインチューニング) Service Quotas で調整可能 (上の表の注を参照)
トレーニングサンプルのテキストプロンプトの長さ、文字単位 0 2,560 いいえ
トレーニングデータセット内のレコード 1,000 500,000 いいえ
入力イメージサイズ 0 5 MB いいえ
入力イメージの高さをピクセル単位で表示 128 4096 いいえ
入力イメージの幅をピクセル単位で表示 128 4096 いいえ
入力イメージの合計ピクセル 0 12,528,912 いいえ
入力イメージのアスペクト比 1:4 4:1 いいえ
トレーニングレコードと検証レコードの合計 該当なし 50,000 はい
Cohere Command
説明 最大 (ファインチューニング) Service Quotas で調整可能 (上の表の注を参照)
入力トークン 4,096 いいえ
出力トークン 2,048 いいえ
データセット内のサンプルあたりの文字数クォータ トークンクォータ x 6 いいえ
トレーニングデータセット内のレコード 10,000 いいえ
検証データセット内のレコード 1,000 いいえ
Meta ラマ 2
説明 最大 (ファインチューニング) Service Quotas で調整可能 (上の表の注を参照)
入力トークン 4,096 いいえ
出力トークン 2,048 いいえ
データセット内のサンプルあたりの文字数クォータ トークンクォータ x 6 いいえ
トレーニングレコードと検証レコードの合計 10,000 はい

プロビジョンドスループットのクォータ

プロビジョンドスループットには以下のクォータが適用されます。

注記

クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォームを使用してリクエストを送信し、引き上げを検討できます。

説明 デフォルト値 Service Quotas で調整可能 (上の表の注を参照)
コミットなしのプロビジョンドスループットに分散できるモデルユニット 2 いいえ
コミットメントでプロビジョンドスループット全体に分散できるモデルユニット 0 いいえ

モデル評価ジョブのクォータ

モデル評価ジョブには、次のクォータが適用されます。

ジョブタイプ 説明 デフォルト 引き上げ可能

自動化

自動モデル評価ジョブで指定できるデータセットの最大数。これには、カスタムプロンプトデータセットと組み込みプロンプトデータセットの両方が含まれます。

5 いいえ

自動化

自動モデル評価ジョブでデータセットごとに指定できるメトリクスの最大数。これには、カスタムメトリクスと組み込みメトリクスの両方が含まれます。

3 いいえ
Human

ヒューマンワーカーを使用するモデル評価ジョブで指定できるカスタムメトリクスの最大数。

10 いいえ

自動化

自動モデル評価ジョブで指定できるモデルの最大数。

1 いいえ
Human

ヒューマンワーカーを使用するモデル評価ジョブで指定できるモデルの最大数。

2 いいえ
自動化

現在のリージョンで、このアカウントで一度に指定できる自動モデル評価ジョブの最大数。

20 いいえ
Human

現在のリージョンで、このアカウントで一度に指定できるヒューマンワーカーを使用するモデル評価ジョブの最大数。

10 いいえ
両方

このアカウントで現在のリージョンに作成できるモデル評価ジョブの最大数。

500 いいえ
Human

現在のリージョンで、このアカウントのヒューマンベースモデル評価ジョブで指定できるカスタムプロンプトデータセットの最大数。

1 いいえ
両方

カスタムプロンプトデータセットに含めることができるプロンプトの最大数。

1,000 いいえ
両方

個々のプロンプトの最大サイズ (KB 単位) は、カスタムプロンプトデータセットです。

4 KB いいえ
Human

ワーカーがタスクを完了するために必要な最大時間 (日数)。

30 いいえ