ランタイムクォータバッチ推論クォータナレッジベースのクォータエージェントクォータモデルカスタマイズのクォータプロビジョンドスループットのクォータモデル評価ジョブのクォータ

Amazon Bedrock のクォータ

には、ごとに、以前 AWS アカウントは制限と呼ばれていたデフォルトのクォータがあります AWS のサービス。特に明記されていない限り、各クォータは内でリージョン固有です AWS アカウント。一部のクォータは調整可能です。次のリストでは、次の表のService Quotas」列の意味について説明します。

クォータが「はい」とマークされている場合は、Service Quotas ユーザーガイド」の「クォータ引き上げのリクエスト」の手順に従って調整できます。
クォータが「いいえ」とマークされている場合、次のいずれかの方法でクォータの引き上げをリクエストできる場合があります。
- オンデマンドランタイムクォータのクォータ引き上げをリクエストするには、 AWS アカウントマネージャーにお問い合わせください。 AWS アカウントマネージャーがない場合は、現時点ではクォータを増やすことはできません。
- 他のクォータの引き上げをリクエストするには、制限引き上げフォームを使用してリクエストを送信し、引き上げを検討します。
注記
圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様には優先順位が付けられます。この条件を満たさない場合、リクエストが拒否される場合があります。

一部のクォータはモデルによって異なります。特に明記されていない限り、クォータはモデルのすべてのバージョンに適用されます。

トピックを選択すると、そのクォータの詳細が表示されます。

ランタイムクォータ

レイテンシーはモデルによって異なり、次の条件に直接比例します。

入力トークンと出力トークンの数
その時点でのすべての顧客による継続的なオンデマンドリクエストの合計数。

モデル推論を実行するときは、以下のクォータが適用されます。これらのクォータは、 InvokeModelおよび InvokeModelWithResponseStreamリクエストの合計を考慮します。

スループットを高めるには、を購入しますAmazon Bedrock のプロビジョンドスループット。

注記

クォータが Service Quotas で調整できないとマークされている場合は、 AWS アカウントマネージャーに連絡してクォータの引き上げをリクエストできます。 AWS アカウントマネージャーがない場合は、現時点ではクォータを増やすことはできません。圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様には優先順位が付けられます。この条件を満たさない場合、リクエストが拒否される場合があります。

モデル	1 分あたりに処理されるリクエスト数	1 分あたりに処理されるトークン数	Service Quotas で調整可能 (上の表の注を参照）
AI21 Labs Jurassic-2 Mid	400	300,000	いいえ
AI21 Labs Jurassic-2 Ultra	100	300,000	いいえ
Amazon Titan Embeddings G1 - Text	2,000	300,000	いいえ
Amazon Titan Image Generator G1	60	該当なし	いいえ
Amazon Titan Multimodal Embeddings G1	2,000	300,000	いいえ
Amazon Titan Text G1 - Express	400	300,000	いいえ
Amazon Titan Text G1 - Lite	800	300,000	いいえ
Amazon Titan Text プレミアム	100	300,000	いいえ
Anthropic Claude Instant	1,000	1,000,000	いいえ
Anthropic Claude 2.x	500	500,000	いいえ
Anthropic Claude 3 Sonnet	500	1,000,000	いいえ
Anthropic Claude 3 Haiku	1,000	2,000,000	いいえ
Anthropic Claude 3 Opus	50	400,000	いいえ
Cohere Command R	400	300,000	いいえ
Cohere Command R+	400	300,000	いいえ
Cohere Command	400	300,000	いいえ
Cohere Command Light	800	300,000	いいえ
Cohere Embed (英語）	2,000	300,000	いいえ
Cohere Embed (多言語）	2,000	300,000	いいえ
Meta Llama 2 13B	800	300,000	いいえ
Meta Llama 2 70B	400	300,000	いいえ
Meta Llama 3 8b Instruct	800	300,000	いいえ
Meta Llama 3 70b Instruct	400	300,000	いいえ
Mistral AI Mistral 7B Instruct	800	300,000	いいえ
Mistral AI Mistral Large	400	300,000	いいえ
Mistral AI Mixtral 8X7B Instruct	400	300,000	いいえ
Stable Diffusion XL	60	該当なし	いいえ

タブを選択すると、モデル固有の推論クォータが表示されます。

Amazon タイタン Text models

説明	値	Service Quotas で調整可能 (上の表の注を参照）
テキストプロンプトの長さ、文字単位	42,000	いいえ

Amazon Titan Image Generator G1

説明	値	Service Quotas で調整可能 (上の表の注を参照）
テキストプロンプトの長さ、文字単位	1,024	いいえ
入力イメージサイズ	5 MB	いいえ
入力イメージの高さをピクセル単位で (インペインティング/アウトペインティング）	1,024	いいえ
入力イメージの幅 (インペインティング/アウトペインティング）	1,024	いいえ
入力イメージの高さをピクセル単位で (イメージバリエーション）	4,096	いいえ
入力画像の幅をピクセル単位で (画像バリエーション）	4,096	いいえ
入力イメージの合計ピクセル	12,582,912	いいえ

Amazon Titan Embeddings G1 - Text

説明	値	Service Quotas で調整可能 (上の表の注を参照）
文字単位のテキスト入力の長さ	50,000	いいえ

Amazon Titan Multimodal Embeddings G1

説明	値	Service Quotas で調整可能 (上の表の注を参照）
文字単位のテキスト入力の長さ	100,000	いいえ
Base64-encodedイメージの文字列、文字単位	25,000,000	いいえ

バッチ推論クォータ

バッチ推論を実行するときは、以下のクォータが適用されます。クォータは入出力データのモダリティによって異なります。

注記

クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォームを使用してリクエストを送信し、引き上げを検討できます。

モダリティ	最小ファイルサイズ	最大ファイルサイズ	Service Quotas で調整可能 (上の表の注を参照）
テキストから埋め込みへ	75 MB	500 MB	いいえ
テキストからテキストへ	20 MB	150 MB	いいえ
テキスト/画像から画像へ	1 MB	50 MB	いいえ

ナレッジベースのクォータ

Amazon Bedrock のナレッジベースには、次のクォータが適用されます。

注記

説明	最大値	Service Quotas で調整可能 (上の表の注を参照）	説明
アカウントあたりのナレッジベース	100	いいえ	アカウントあたりのナレッジベースの最大数。
ナレッジベースあたりのデータソース	5	いいえ	ナレッジベースあたりのデータソースの最大数。
データソースのチャンクサイズ (Titanテキスト G1 - 埋め込み）	8,192	いいえ	を使用したデータソースの最大サイズ (KB)Titan Embeddings G1 - Text。
データソースチャンクサイズ (CohereEmbed英語）	512	いいえ	Cohere Embed 英語を使用したデータソースの最大サイズ (KB)。
データソースチャンクサイズ (CohereEmbed多言語）	512	いいえ	Cohere Embed 多言語を使用したデータソースの最大サイズ (KB)。
取り込みジョブごとに追加または更新するファイル	5,000,000	いいえ	取り込みジョブごとに取り込むことができる新規および更新されたファイルの最大数。
取り込みジョブごとに削除するファイル	5,000,000	いいえ	取り込みジョブごとに削除できるファイルの最大数。
取り込みジョブファイルサイズ (ソースドキュメント）	50 MB	いいえ	取り込みジョブのソースドキュメントファイルの最大サイズ (MB)。
取り込みジョブファイルのサイズ (メタデータファイル）	10 KB	いいえ	取り込みジョブ内のメタデータファイルの最大サイズ (KB)。
取り込みジョブのサイズ	100 GB	いいえ	取り込みジョブの最大サイズ (GB 単位）。
データソースあたりの同時取り込みジョブ	1	いいえ	データソースに対して同時に実行できる取り込みジョブの最大数。
ナレッジベースあたりの同時取り込みジョブ	1	いいえ	ナレッジベースで同時に実行できる取り込みジョブの最大数。
アカウントあたりの同時取り込みジョブ	5	いいえ	アカウントで同時に実行できる取り込みジョブの最大数。
ユーザークエリサイズ	1,000	いいえ	ユーザークエリの最大サイズ (文字単位）。

Amazon Bedrock 関連の API リクエストのナレッジベースには、次のスロットリング制限が適用されます。

API オペレーション	1 秒あたりの最大リクエスト数	Service Quotas で調整可能 (上の表の注を参照）
Retrieve	5	いいえ
RetrieveAndGenerate	5	いいえ
ListKnowledgeBases	10	いいえ
GetKnowledgeBase	10	いいえ
DeleteKnowledgeBase	2	いいえ
UpdateKnowledgeBase	2	いいえ
CreateKnowledgeBase	2	いいえ
ListIngestionJobs	10	いいえ
StartIngestionJob	0.1	いいえ
GetIngestionJob	10	いいえ
ListDataSources	10	いいえ
GetDataSource	10	いいえ
DeleteDataSource	2	いいえ
UpdateDataSource	2	いいえ
CreateDataSource	2	いいえ

エージェントクォータ

Agents for Amazon Bedrock には、次のクォータが適用されます。

注記

クォータ	最大値	Service Quotas で調整可能 (上の表の注を参照）	説明
アカウントあたりのエージェント	50	はい	1 つのアカウント内のエージェントの最大数。
エージェントあたりの関連付けられたエイリアス	10	いいえ	エージェントに関連付けることができるエイリアスの最大数。
エージェント指示書の文字	4,000	はい	エージェントの指示の最大文字数。
エージェントあたりのアクショングループ	20	はい	エージェントに追加できるアクショングループの最大数。
エージェントごとに有効になっているアクショングループ	11	はい	エージェントで有効にできるアクショングループの最大数。
エージェントあたりの APIs または関数	11	はい	エージェントに追加できる APIs の最大数。
関数あたりのパラメータ	5	いいえ	アクショングループの関数に追加できるパラメータの最大数。
Lambda レスポンスペイロードサイズ	25 KB	いいえ	アクショングループ Lambda レスポンスのペイロードの最大サイズ。
エージェントあたりの関連付けられたナレッジベース	2	はい	エージェントに関連付けることができるナレッジベースの最大数。

次のスロットリング制限は、Amazon Bedrock 関連の API リクエストのエージェントに適用されます。

API オペレーション	1 秒あたりの最大リクエスト数	Service Quotas で調整可能 (上の表の注を参照）
AssociateAgentKnowledgeBase	6	いいえ
CreateAgent	6	いいえ
CreateAgentActionGroup	12	いいえ
CreateAgentAlias	2	いいえ
DeleteAgent	2	いいえ
DeleteAgentActionGroup	2	いいえ
DeleteAgentAlias	2	いいえ
DeleteAgentVersion	2	いいえ
DisassociateAgentKnowledgeBase	4	いいえ
GetAgent	15	いいえ
GetAgentActionGroup	20	いいえ
GetAgentAlias	10	いいえ
GetAgentKnowledgeBase	15	いいえ
GetAgentVersion	10	いいえ
ListAgents	10	いいえ
ListAgentActionGroups	10	いいえ
ListAgentAliases	10	いいえ
ListAgentKnowledgeBases	10	いいえ
ListAgentVersions	10	いいえ
PrepareAgent	2	いいえ
UpdateAgent	4	いいえ
UpdateAgentActionGroup	6	いいえ
UpdateAgentAlias	2	いいえ
UpdateAgentKnowledgeBase	4	いいえ

モデルカスタマイズのクォータ

モデルカスタマイズには、次のクォータが適用されます。

注記

説明	最大値	Service Quotas で調整可能 (上の表の注を参照）
アカウントでインポートされたモデルの最大数。	0	はい
スケジュールされたカスタマイズジョブの最大数。	2	いいえ
アカウント内のカスタムモデルの最大数。	100	はい

ハイパーパラメータクォータを確認するには、「」を参照してくださいカスタムモデルのハイパーパラメータ。

タブを選択すると、さまざまな基盤モデルのカスタマイズに使用されるトレーニングデータセットと検証データセットに適用されるモデル固有のクォータが表示されます。

注記

Amazon Titan Text Premier

説明	最大 (継続的な事前トレーニング) 使用できません	最大 (ファインチューニング) プレビューのみ	Service Quotas で調整可能 (上の表の注を参照）
バッチサイズが 1 の場合の入力トークンと出力トークンの合計	該当なし	4,096	いいえ
バッチサイズが 2、3、または 4 の場合の入力トークンと出力トークンの合計	該当なし	該当なし	いいえ
データセット内のサンプルあたりの文字数クォータ	該当なし	トークンクォータ x 6	いいえ
トレーニングレコードと検証レコードの合計	該当なし	20,000	はい
トレーニングデータセットのファイルサイズ	該当なし	1 GB	いいえ
検証データセットのファイルサイズ	該当なし	100 MB	いいえ

Amazon Titan Text G1 - Express

説明	最大 (継続的な事前トレーニング）	最大 (ファインチューニング）	Service Quotas で調整可能 (上の表の注を参照）
バッチサイズが 1 の場合の入力トークンと出力トークンの合計	4,096	4,096	いいえ
バッチサイズが 2、3、または 4 の場合の入力トークンと出力トークンの合計	2,048	2,048	いいえ
データセット内のサンプルあたりの文字数クォータ	トークンクォータ x 6	トークンクォータ x 6	いいえ
トレーニングレコードと検証レコードの合計	100,000	10,000	はい
トレーニングデータセットのファイルサイズ	10 GB	1 GB	いいえ
検証データセットのファイルサイズ	100 MB	100 MB	いいえ

Amazon Titan Text G1 - Lite

説明	最大 (継続的な事前トレーニング）	最大 (ファインチューニング）	Service Quotas で調整可能 (上の表の注を参照）
バッチサイズが 1 または 2 の場合の入力トークンと出力トークンの合計	4,096	4,096	いいえ
バッチサイズが 3、4、5、または 6 の場合の入力トークンと出力トークンの合計	2,048	2,048	いいえ
データセット内のサンプルあたりの文字数クォータ	トークンクォータ x 6	トークンクォータ x 6	いいえ
トレーニングレコードと検証レコードの合計	100,000	10,000	はい
トレーニングデータセットのファイルサイズ	10 GB	1 GB	いいえ
検証データセットのファイルサイズ	100 MB	100 MB	いいえ

Amazon Titan Image Generator G1

説明	最小 (微調整）	最大 (ファインチューニング）	Service Quotas で調整可能 (上の表の注を参照）
トレーニングサンプルのテキストプロンプトの長さ、文字単位	3	1,024	いいえ
トレーニングデータセット内のレコード	5	10,000	いいえ
入力イメージサイズ	0	50 MB	いいえ
入力イメージの高さをピクセル単位で表示	512	4,096	いいえ
入力イメージの幅をピクセル単位で表示	512	4,096	いいえ
入力イメージの合計ピクセル	0	12,582,912	いいえ
入力イメージのアスペクト比	1:4	4:1	いいえ
トレーニングレコードと検証レコードの合計	該当なし	10,000	はい

Amazon Titan Multimodal Embeddings G1

説明	最小 (微調整）	最大 (ファインチューニング）	Service Quotas で調整可能 (上の表の注を参照）
トレーニングサンプルのテキストプロンプトの長さ、文字単位	0	2,560	いいえ
トレーニングデータセット内のレコード	1,000	500,000	いいえ
入力イメージサイズ	0	5 MB	いいえ
入力イメージの高さをピクセル単位で表示	128	4096	いいえ
入力イメージの幅をピクセル単位で表示	128	4096	いいえ
入力イメージの合計ピクセル	0	12,528,912	いいえ
入力イメージのアスペクト比	1:4	4:1	いいえ
トレーニングレコードと検証レコードの合計	該当なし	50,000	はい

Cohere Command

説明	最大 (ファインチューニング）	Service Quotas で調整可能 (上の表の注を参照）
入力トークン	4,096	いいえ
出力トークン	2,048	いいえ
データセット内のサンプルあたりの文字数クォータ	トークンクォータ x 6	いいえ
トレーニングデータセット内のレコード	10,000	いいえ
検証データセット内のレコード	1,000	いいえ

Meta ラマ 2

説明	最大 (ファインチューニング）	Service Quotas で調整可能 (上の表の注を参照）
入力トークン	4,096	いいえ
出力トークン	2,048	いいえ
データセット内のサンプルあたりの文字数クォータ	トークンクォータ x 6	いいえ
トレーニングレコードと検証レコードの合計	10,000	はい

プロビジョンドスループットのクォータ

プロビジョンドスループットには以下のクォータが適用されます。

注記

説明	デフォルト値	Service Quotas で調整可能 (上の表の注を参照）
コミットなしのプロビジョンドスループットに分散できるモデルユニット	2	いいえ
コミットメントでプロビジョンドスループット全体に分散できるモデルユニット	0	いいえ

モデル評価ジョブのクォータ

モデル評価ジョブには、次のクォータが適用されます。

ジョブタイプ	説明	デフォルト	引き上げ可能
自動化	自動モデル評価ジョブで指定できるデータセットの最大数。これには、カスタムプロンプトデータセットと組み込みプロンプトデータセットの両方が含まれます。	5	いいえ
自動化	自動モデル評価ジョブでデータセットごとに指定できるメトリクスの最大数。これには、カスタムメトリクスと組み込みメトリクスの両方が含まれます。	3	いいえ
Human	ヒューマンワーカーを使用するモデル評価ジョブで指定できるカスタムメトリクスの最大数。	10	いいえ
自動化	自動モデル評価ジョブで指定できるモデルの最大数。	1	いいえ
Human	ヒューマンワーカーを使用するモデル評価ジョブで指定できるモデルの最大数。	2	いいえ
自動化	現在のリージョンで、このアカウントで一度に指定できる自動モデル評価ジョブの最大数。	20	いいえ
Human	現在のリージョンで、このアカウントで一度に指定できるヒューマンワーカーを使用するモデル評価ジョブの最大数。	10	いいえ
両方	このアカウントで現在のリージョンに作成できるモデル評価ジョブの最大数。	500	いいえ
Human	現在のリージョンで、このアカウントのヒューマンベースモデル評価ジョブで指定できるカスタムプロンプトデータセットの最大数。	1	いいえ
両方	カスタムプロンプトデータセットに含めることができるプロンプトの最大数。	1,000	いいえ
両方	個々のプロンプトの最大サイズ (KB 単位) は、カスタムプロンプトデータセットです。	4 KB	いいえ
Human	ワーカーがタスクを完了するために必要な最大時間 (日数）。	30	いいえ

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

AWS CloudFormation リソース

API リファレンス