Amazon Bedrock のクォータ - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Bedrock のクォータ

の AWS アカウント には、Amazon Bedrock のデフォルトクォータがあり、以前は制限と呼ばれていました。Amazon Bedrock のサービスクォータを表示するには、「サービスクォータの表示」の手順に従って、Amazon Bedrock をサービスとして選択します。一部のクォータはモデルによって異なります。特に明記されていない限り、クォータはモデルのすべてのバージョンに適用されます。

サービスのパフォーマンスを維持し、Amazon Bedrock の適切な使用を確保するために、リージョンの要因、支払い履歴、不正使用、および/またはクォータ引き上げリクエストの承認に応じて、アカウントに割り当てられたデフォルトのクォータが更新される場合があります。

アカウントのクォータの引き上げをリクエストするには、次の手順に従います。

  • 次の表のService Quotasタ」列でクォータが「はい」とマークされている場合は、「Service Quotas ユーザーガイド」の「Service Quotas ユーザーガイド」の「クォータ引き上げのリクエストService Quotasタを調整できます。 Service Quotas

  • 一部のクォータは、次の表の「Service Quotas で調整可能」列で「いいえ」とマークされています。 Service Quotas つまり、調整できません。

    例外をリクエストするには:

    注記

    圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様には優先順位が付けられます。この条件を満たさない場合、リクエストが拒否される可能性があります。

トピックを選択すると、デフォルトのグローバルクォータの詳細が表示されます。特に指定がない限り、すべてのグローバルクォータとリージョンクォータは同じです。

モデル推論を実行するときは、以下のクォータが適用されます。これらのクォータは、Converse 、、ConverseStreamInvokeModelおよび InvokeModelWithResponseStreamリクエストの合計を考慮します。推論レイテンシーはモデルによって異なり、その時点でのすべての顧客による入力トークンと出力トークンの数、および進行中のオンデマンドリクエストの合計数に直接比例します。スループットが保証されるように、プロビジョンドスループット を試すことをお勧めします。

モデル 1 分あたりに処理されるリクエスト数 1 分あたりに処理されるトークン数 リージョン Service Quotas で調整可能
AI21 Labs Jurassic-2 Mid 400 300,000 us-east-1 なし
AI21 Labs Jurassic-2 Ultra 100 300,000 すべて なし
AI21 Jamba-Instruct 100 300,000 すべて なし
Amazon Titan Text Embeddings V1 2,000 300,000 すべて なし
Amazon Titan Text Embeddings V2 2,000 300,000 すべて なし
Amazon Titan Image Generator G1 V1 60 該当なし すべて なし
Amazon Titan Image Generator G1 V2 60 該当なし すべて なし
Amazon Titan Multimodal Embeddings G1 2,000 300,000 すべて なし
Amazon Titan Text G1 - Express 400 300,000 すべて なし
Amazon Titan Text G1 - Lite 800 300,000 すべて なし
Amazon Titan Text Premier 100 300,000 すべて なし
Anthropic Claude Instant 1,000 1,000,000

us-east-1

us-west-2

なし
400 300,000 その他のリージョン
Anthropic Claude 2.x 500 500,000

us-east-1

us-west-2

なし
100 200,000 件の その他のリージョン
Anthropic Claude 3 Sonnet 500 1,000,000

us-east-1

us-west-2

なし
100 200,000 件の その他のリージョン
Anthropic Claude 3 Haiku 1,000 2,000,000

us-east-1

us-west-2

なし
200 200,000 件の

ap-northeast-1

ap-southeast-1

400 300,000 その他のリージョン
Anthropic Claude 3.5 Sonnet 250 2,000,000 us-west-2 なし
20 200,000 件の

ap-northeast-1

ap-southeast-1

eu-central-1

なし
50 400,000 その他のリージョン なし
Anthropic Claude 3 Opus 50 400,000 すべて なし
Cohere Command R 400 300,000 すべて なし
Cohere Command R+ 400 300,000 すべて なし
Cohere Command 400 300,000 すべて なし
Cohere Command Light 800 300,000 すべて なし
Cohere Embed (英語) 2,000 300,000 すべて なし
Cohere Embed (多言語) 2,000 300,000 すべて なし
Meta Llama 2 13B 800 300,000 すべて なし
Meta Llama 2 70B 400 300,000 すべて なし
Meta Llama 3 8B Instruct 800 300,000 すべて なし
Meta Llama 3 70B Instruct 400 300,000 すべて なし
Meta Llama 3.1 8B Instruct 800 300,000 us-west-2 なし
Meta Llama 3.1 70B Instruct 400 300,000 us-west-2 なし
Meta Llama 3.1 405B Instruct 200 400,000 us-west-2 なし
Mistral AI Mistral 7B Instruct 800 300,000 すべて なし
Mistral AI Mixtral 8X7B Instruct 400 300,000 すべて なし
Mistral AI Mistral Large 400 300,000 すべて なし
Mistral AI Mistral Large 2 (24.07) 400 300,000 us-west-2 なし
Mistral AI Mistral Small 400 300,000 すべて なし
Stable Diffusion XL 60 該当なし すべて なし
Stable Diffusion 3 60 該当なし 米国西部 (オレゴン) (us-west-2) なし
Stable Diffusion 3 ラージ 15 該当なし 米国西部 (オレゴン) (us-west-2) なし
安定イメージ Ultra 10 該当なし 米国西部 (オレゴン) (us-west-2) なし
安定した Image Core 90 該当なし 米国西部 (オレゴン) (us-west-2) なし

次の表は、Amazon Bedrock のさまざまなAPIオペレーションで 1 秒あたりに実行できるAPIリクエストの最大数を示しています。

機能 API オペレーション 1 秒あたりの最大リクエスト数
該当なし 会話 200
ConverseStream 200
DeleteModelInvocationLoggingConfiguration 1
GetFoundationModel 10
GetModelInvocationLoggingConfiguration 10
InvokeModel 200
InvokeModelWithResponseStream 200
ListFoundationModels 10
ListTagsForResource 20
PutModelInvocationLoggingConfiguration 1
TagResource 20
UntagResource 20
エージェント AssociateAgentKnowledgeBase 6
CreateAgent 6
CreateAgentActionGroup 12
CreateAgentAlias 2
DeleteAgent 2
DeleteAgentActionGroup 2
DeleteAgentAlias 2
DeleteAgentVersion 2
DisassociateAgentKnowledgeBase 4
GetAgent 15
GetAgentActionGroup 20
GetAgentAlias 10
GetAgentKnowledgeBase 15
GetAgentVersion 10
ListAgents 10
ListAgentActionGroups 10
ListAgentAliases 10
ListAgentKnowledgeBases 10
ListAgentVersions 10
PrepareAgent 2
UpdateAgent 4
UpdateAgentActionGroup 6
UpdateAgentAlias 2
UpdateAgentKnowledgeBase 4
カスタムモデル CreateModelCustomizationJob 1
DeleteCustomModel 10
GetCustomModel 10
GetModelCustomizationJob 10
ListModelCustomizationJobs 10
StopModelCustomizationJob 10
ガードレール CreateGuardrail 1
CreateGuardrailVersion 1
DeleteGuardrail 1
GetGuardrail 10
ListGuardrails 10
UpdateGuardrail 1
ナレッジベース CreateDataSource 2
CreateKnowledgeBase 2
DeleteDataSource 2
DeleteKnowledgeBase 2
GetDataSource 10
GetIngestionJob 10
GetKnowledgeBase 10
ListDataSources 10
ListIngestionJobs 10
ListKnowledgeBases 10
Retrieve 5
RetrieveAndGenerate 5
StartIngestionJob 0.1
UpdateDataSource 2
UpdateKnowledgeBase 2
モデル評価 CreateEvaluationJob 5
GetEvaluationJob 10
ListEvaluationJobs 10
StopEvaluationJob 5
プロビジョンドスループット CreateProvisionedModelThroughput 1
DeleteProvisionedModelThroughput 1
GetProvisionedModelThroughput 10
ListProvisionedModelThroughputs 10
UpdateProvisionedModelThroughput 1

タブを選択すると、プロンプトのモデル固有のクォータが表示されます。

Amazon Titan Text models
説明 Service Quotas で調整可能
テキストプロンプトの長さ、文字単位 42,000 なし
Amazon Titan Image Generator G1 V1
説明 Service Quotas で調整可能
テキストプロンプトの長さ、文字単位 1,024 なし
入力イメージサイズ 5 MB なし
入力イメージの高さをピクセル単位で (インペインティング/アウトペインティング) 1,024 なし
入力イメージの幅 (インペインティング/アウトペインティング) 1,024 なし
入力画像の高さをピクセル単位で (画像バリエーション) 4,096 なし
入力画像の幅をピクセル単位で (画像バリエーション) 4,096 なし
入力イメージの合計ピクセル 12,582,912 なし
Amazon Titan Embeddings G1 - Text
説明 Service Quotas で調整可能
文字単位のテキスト入力の長さ 50,000 なし
Amazon Titan Multimodal Embeddings G1
説明 Service Quotas で調整可能
文字単位のテキスト入力の長さ 100,000 なし
Base64-encodedイメージの文字列、文字単位 25,000,000 なし

バッチ推論を実行する場合、次のクォータが適用されます。

クォータ 最大値 Service Quotas で調整可能 説明
ベースモデルの同時バッチ推論ジョブ 3 あり ベースモデルで進行中のバッチ推論ジョブの最大数。
カスタムモデルの同時バッチ推論ジョブ 3 あり カスタムモデルで進行中のバッチ推論ジョブの最大数。
バッチ推論入力ファイルあたりのレコード 50,000 あり バッチ推論ジョブの入力ファイルに含めることができるレコードの最大数。
バッチ推論ジョブあたりのレコード 50,000 あり バッチ推論ジョブに含めることができるレコードの最大数。
バッチ推論ジョブあたりの最小レコード数 1,000 なし バッチ推論ジョブに含めることができるレコードの最小数。
バッチ推論入力ファイルサイズ 200 MB あり バッチ推論用に送信された 1 つのファイルの最大サイズ (バイト単位)。
バッチ推論ジョブのサイズ 1 GB あり バッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ。

ガードレールを使用する場合、次のクォータが適用されます。

クォータ 説明
アカウントあたりのガードレール アカウント内のガードレールの最大数。 100
ガードレールあたりのバージョン ガードレールが保持できるバージョンの最大数。 20
トピックガードレールあたりのトピック ガードレールトピックポリシー全体で定義できるトピックの最大数。 30
トピックあたりのフレーズの例 トピックに含めることができるトピック例の最大数。 5
機密情報フィルターの正規表現 機密情報ポリシーに含めることができるガードレールフィルター正規表現の最大数 10
正規表現の文字数 ガードレールフィルター正規表現の最大長。文字単位。 500
Word ポリシーあたりの単語 ブロックされた単語リストに含めることができる単語の最大数。 10,000
文字単位の単語長 ブロックされた単語リスト内の単語の最大長。文字単位。 100
オンデマンド ApplyGuardrail リクエスト/秒 1 秒あたりに ApplyGuardrail API実行できる呼び出しの最大数。 25
オンデマンド ApplyGuardrail で拒否されたトピックポリシーのテキスト単位/秒。 拒否されたトピックポリシーで処理できる 1 秒あたりのテキストユニットの最大数。 25
オンデマンド ApplyGuardrail コンテンツフィルターポリシーのテキスト単位/秒 コンテンツフィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数。 25
オンデマンド ApplyGuardrail Word フィルターポリシーのテキスト単位/秒 Word フィルターポリシーで処理できる 1 秒あたりのテキスト単位の最大数。 25
オンデマンド ApplyGuardrail の機密情報フィルターポリシーのテキスト単位/秒 機密情報フィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数。 25
注記

テキスト単位は最大 1,000 文字です

Amazon Bedrock ナレッジベースには、次のクォータが適用されます。

説明 最大値 Service Quotas で調整可能 説明
リージョンごとのアカウントあたりのナレッジベース 100 なし アカウントあたりのナレッジベースの最大数。
ナレッジベースあたりのデータソース 5 なし ナレッジベースあたりのデータソースの最大数。
データソースチャンクサイズ (Titan テキスト G1 - 埋め込み) 8,192 なし を使用したデータソースの最大サイズ (KB) Titan Embeddings G1 - Text.
データソースチャンクサイズ (Cohere Embed 英語) 512 なし を使用したデータソースの最大サイズ (KB) Cohere Embed 英語。
データソースチャンクサイズ (Cohere Embed 多言語) 512 なし を使用したデータソースの最大サイズ (KB) Cohere Embed 多言語。
チャンクあたりのデータソースメタデータフィールド/属性の合計。 250 なし チャンクあたりのドキュメントメタデータフィールド/属性の最大数。
Web Crawler のデータソースクロールされたコンテンツ項目の合計数 25,000 なし クロールできるウェブページコンテンツ項目の最大数 (コンテンツ項目あたり最大 50 MB)。
データソースのクロールされたファイルの合計数 250 万 なし クロールできるデータソースファイルまたはコンテンツ項目の最大数 (ファイル/コンテンツ項目あたり最大 50 MB)。
高度な解析の合計データサイズ 100 MB なし 高度な解析を使用して解析できるデータの最大結合サイズ (MB)。
合計ファイルの高度な解析 100 なし 高度な解析を使用して解析できるファイルの最大数。
取り込みジョブごとに追加または更新するファイル 5,000,000 なし 取り込みジョブごとに取り込むことができる新規および更新されたファイルの最大数。
取り込みジョブごとに削除するファイル 5,000,000 なし 取り込みジョブごとに削除できるファイルの最大数。
取り込みジョブファイルサイズ (ソースドキュメント) 50 MB なし 取り込みジョブのソースドキュメントファイルの最大サイズ (MB)。
取り込みジョブファイルのサイズ (メタデータファイル) 10 KB なし 取り込みジョブ内のメタデータファイルの最大サイズ (KB)。
取り込みジョブのサイズ 100 GB なし 取り込みジョブの最大サイズ (GB 単位)。
データソースあたりの同時取り込みジョブ 1 なし データソースに対して同時に実行できる取り込みジョブの最大数。
ナレッジベースあたりの同時取り込みジョブ 1 なし ナレッジベースで同時に実行できる取り込みジョブの最大数。
アカウントあたりの同時取り込みジョブ 5 なし アカウントで同時に実行できる取り込みジョブの最大数。
ユーザークエリサイズ 1,000 なし ユーザークエリの最大サイズ (文字単位)。

Amazon Bedrock エージェントには、次のクォータが適用されます。

クォータ 最大値 Service Quotas で調整可能 説明
アカウントあたりのエージェント 50 あり 1 つのアカウント内のエージェントの最大数。
エージェントあたりの関連付けられたエイリアス 10 なし エージェントに関連付けることができるエイリアスの最大数。
エージェント指示書の文字 4,000 あり エージェントの指示の最大文字数。
エージェントあたりのアクショングループ 20 あり エージェントに追加できるアクショングループの最大数。
エージェントごとに有効になっているアクショングループ 11 あり エージェントで有効にできるアクショングループの最大数。
APIs エージェントあたりの または 関数 11 あり エージェントに追加APIsできる の最大数。
関数あたりのパラメータ 5 あり アクショングループの関数に追加できるパラメータの最大数。
Lambda レスポンスペイロードサイズ 25 KB なし アクショングループ Lambda レスポンスのペイロードの最大サイズ。
エージェントあたりの関連付けられたナレッジベース 2 あり エージェントに関連付けることができるナレッジベースの最大数。

プロンプト管理には、次のクォータが適用されます。

クォータ 最大値 Service Quotas で調整可能 説明
アカウントあたりのプロンプト 50 なし アカウントで保持できるプロンプト管理のプロンプトの最大数。
プロンプトあたりのバージョン 10 なし プロンプト管理のプロンプトに含めることができるバージョンの最大数。

プロンプトフローには、次のクォータが適用されます。

クォータ 最大値 Service Quotas で調整可能 説明
アカウントあたりのプロンプトフロー 10 なし アカウントに含めることができるプロンプトフローの最大数。
プロンプトフローあたりのノード 20 なし プロンプトフローに含めることができるノードの最大数。
プロンプトフローあたりのバージョン 10 なし プロンプトフローが保持できるバージョンの最大数。
プロンプトフローあたりのエイリアス 10 なし プロンプトフローに関連付けることができるエイリアスの最大数。
アカウントあたりのプロンプトフロー 10 なし アカウントに含めることができるプロンプトフローの最大数。
アカウントあたりのプロンプトフロー 10 なし アカウントに含めることができるプロンプトフローの最大数。
プロンプトフローあたりのフロー入力ノード 1 なし プロンプトフローに追加できるフロー入力ノードの最大数。
プロンプトフローあたりのフロー出力ノード 5 なし プロンプトフローに追加できるフロー出力ノードの最大数。
プロンプトフローあたりの条件ノード 5 なし プロンプトフローに追加できる条件ノードの最大数。
プロンプトフローあたりのイテレーターノード 1 なし プロンプトフローに追加できるイテレーターノードの最大数。
プロンプトフローあたりのコレクターノード 1 なし プロンプトフローに追加できるコレクターノードの最大数。
プロンプトフローあたりのプロンプトノード 5 なし プロンプトフローに追加できるプロンプトノードの最大数。
プロンプトフローあたりの Lambda ノード 5 なし プロンプトフローに追加できる Lambda ノードの最大数。
プロンプトフローあたりの Lex ノード 5 なし プロンプトフローに追加できる Lex ノードの最大数。
プロンプトフローあたりのノードタイプあたりのノード数 5 なし プロンプトフローの各タイプに追加できるノードの最大数。
条件ノードあたりの条件 5 なし プロンプトフローで条件ノードに追加できる条件の最大数。

モデルカスタマイズには、次のクォータが適用されます。

説明 最大値 Service Quotas で調整可能
アカウントでインポートされたモデルの最大数。 3 あり
スケジュールされたカスタマイズジョブの最大数。 2 なし
アカウント内のカスタムモデルの最大数。 100 あり

ハイパーパラメータクォータを確認するには、「」を参照してくださいカスタムモデルのハイパーパラメータ

タブを選択すると、さまざまな基盤モデルのカスタマイズに使用されるトレーニングデータセットと検証データセットに適用されるモデル固有のクォータが表示されます。

Amazon Titan Text Premier
説明 最大 (継続的な事前トレーニング) 使用できません 最大 (ファインチューニング) プレビューのみ Service Quotas で調整可能
バッチサイズが 1 の場合の入力トークンと出力トークンの合計 該当なし 4,096 なし
バッチサイズが 2、3、または 4 の場合の入力トークンと出力トークンの合計 該当なし 該当なし なし
データセット内のサンプルあたりの文字数クォータ 該当なし トークンクォータ x 6 なし
トレーニングレコードと検証レコードの合計 該当なし 20,000 あり
トレーニングデータセットのファイルサイズ 該当なし 1 GB なし
検証データセットのファイルサイズ 該当なし 100 MB なし
Amazon Titan Text G1 - Express
説明 最大 (継続的な事前トレーニング) 最大 (微調整) Service Quotas で調整可能
バッチサイズが 1 の場合の入力トークンと出力トークンの合計 4,096 4,096 なし
バッチサイズが 2、3、または 4 の場合の入力トークンと出力トークンの合計 2,048 2,048 なし
データセット内のサンプルあたりの文字数クォータ トークンクォータ x 6 トークンクォータ x 6 なし
トレーニングレコードと検証レコードの合計 100,000 10,000 あり
トレーニングデータセットのファイルサイズ 10 GB 1 GB なし
検証データセットのファイルサイズ 100 MB 100 MB なし
Amazon Titan Text G1 - Lite
説明 最大 (継続的な事前トレーニング) 最大 (微調整) Service Quotas で調整可能
バッチサイズが 1 または 2 の場合の入力トークンと出力トークンの合計 4,096 4,096 なし
バッチサイズが 3、4、5、または 6 の場合の入力トークンと出力トークンの合計 2,048 2,048 なし
データセット内のサンプルあたりの文字数クォータ トークンクォータ x 6 トークンクォータ x 6 なし
トレーニングレコードと検証レコードの合計 100,000 10,000 あり
トレーニングデータセットのファイルサイズ 10 GB 1 GB なし
検証データセットのファイルサイズ 100 MB 100 MB なし
Amazon Titan Image Generator G1 V1
説明 最小 (微調整) 最大 (微調整) Service Quotas で調整可能
トレーニングサンプルのテキストプロンプトの長さ、文字単位 3 1,024 なし
トレーニングデータセット内のレコード 5 10,000 なし
入力イメージサイズ 0 50 MB なし
入力イメージの高さをピクセル単位で表示 512 4,096 なし
入力イメージの幅をピクセル単位で表示 512 4,096 なし
入力イメージの合計ピクセル 0 12,582,912 なし
入力イメージのアスペクト比 1:4 4:1 なし
トレーニングレコードと検証レコードの合計 該当なし 10,000 あり
Amazon Titan Multimodal Embeddings G1
説明 最小 (微調整) 最大 (微調整) Service Quotas で調整可能
トレーニングサンプルのテキストプロンプトの長さ、文字単位 0 2,560 なし
トレーニングデータセット内のレコード 1,000 500,000 なし
入力イメージサイズ 0 5 MB なし
入力イメージの高さをピクセル単位で表示 128 4096 なし
入力イメージの幅をピクセル単位で表示 128 4096 なし
入力イメージの合計ピクセル 0 12,528,912 なし
入力イメージのアスペクト比 1:4 4:1 なし
トレーニングレコードと検証レコードの合計 該当なし 50,000 あり
Cohere Command
説明 最大 (微調整) Service Quotas で調整可能
入力トークン 4,096 なし
出力トークン 2,048 なし
データセット内のサンプルあたりの文字数クォータ トークンクォータ x 6 なし
トレーニングデータセット内のレコード 10,000 なし
検証データセット内のレコード 1,000 なし
Meta Llama 2
説明 最大 (微調整) Service Quotas で調整可能
入力トークン 4,096 なし
出力トークン 2,048 なし
データセット内のサンプルあたりの文字数クォータ トークンクォータ x 6 なし
トレーニングレコードと検証レコードの合計 10,000 あり

プロビジョンドスループットには以下のクォータが適用されます。

注記

クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォームを使用してリクエストを送信し、引き上げを検討できます。

説明 デフォルト Service Quotas で調整可能
コミットなしのプロビジョンドスループットに分散できるモデルユニット 2 なし
コミットメントでプロビジョンドスループット全体に分散できるモデルユニット 0 なし

モデル評価ジョブには、次のクォータが適用されます。

ジョブタイプ 説明 デフォルト 引き上げ可能

自動化

自動モデル評価ジョブで指定できるデータセットの最大数。これには、カスタムプロンプトデータセットと組み込みプロンプトデータセットの両方が含まれます。

5 なし

自動化

自動モデル評価ジョブでデータセットごとに指定できるメトリクスの最大数。これには、カスタムメトリクスと組み込みメトリクスの両方が含まれます。

3 なし
Human

ヒューマンワーカーを使用するモデル評価ジョブで指定できるカスタムメトリクスの最大数。

10 なし

自動化

自動モデル評価ジョブで指定できるモデルの最大数。

1 なし
Human

ヒューマンワーカーを使用するモデル評価ジョブで指定できるモデルの最大数。

2 なし
自動化

現在のリージョンで、このアカウントで一度に指定できる自動モデル評価ジョブの最大数。

20 なし
Human

現在のリージョンで、このアカウントで一度に指定できるヒューマンワーカーを使用するモデル評価ジョブの最大数。

10 なし
両方

このアカウントで現在のリージョンに作成できるモデル評価ジョブの最大数。

500 なし
Human

現在のリージョンで、このアカウントのヒューマンベースモデル評価ジョブで指定できるカスタムプロンプトデータセットの最大数。

1 なし
両方

カスタムプロンプトデータセットに含めることができるプロンプトの最大数。

1,000 なし
両方

個々のプロンプトの最大サイズ (KB 単位) は、カスタムプロンプトデータセットです。

4 KB なし
Human

ワーカーがタスクを完了するために必要な最大時間 (日数)。

30 いいえ