翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Bedrock のクォータ
の AWS アカウント には、Amazon Bedrock のデフォルトクォータがあり、以前は制限と呼ばれていました。Amazon Bedrock のサービスクォータを表示するには、「サービスクォータの表示」の手順に従って、Amazon Bedrock をサービスとして選択します。一部のクォータはモデルによって異なります。特に明記されていない限り、クォータはモデルのすべてのバージョンに適用されます。
サービスのパフォーマンスを維持し、Amazon Bedrock の適切な使用を確保するために、リージョンの要因、支払い履歴、不正使用、および/またはクォータ引き上げリクエストの承認に応じて、アカウントに割り当てられたデフォルトのクォータが更新される場合があります。
アカウントのクォータの引き上げをリクエストするには、次の手順に従います。
-
次の表のService Quotasタ」列でクォータが「はい」とマークされている場合は、「Service Quotas ユーザーガイド」の「Service Quotas ユーザーガイド」の「クォータ引き上げのリクエストService Quotasタを調整できます。 Service Quotas
-
一部のクォータは、次の表の「Service Quotas で調整可能」列で「いいえ」とマークされています。 Service Quotas つまり、調整できません。
例外をリクエストするには:
-
ランタイムクォータ のクォータ引き上げをリクエストするには、 にお問い合わせください。 AWS アカウント マネージャー。をお持ちでない場合 AWS アカウント マネージャー、現時点ではクォータを増やすことはできません。
-
他のクォータの引き上げをリクエストするには、制限引き上げフォーム
を使用してリクエストを送信し、引き上げを検討します。
注記
圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様には優先順位が付けられます。この条件を満たさない場合、リクエストが拒否される可能性があります。
-
トピックを選択すると、デフォルトのグローバルクォータの詳細が表示されます。特に指定がない限り、すべてのグローバルクォータとリージョンクォータは同じです。
モデル推論を実行するときは、以下のクォータが適用されます。これらのクォータは、Converse 、、ConverseStream、InvokeModelおよび InvokeModelWithResponseStreamリクエストの合計を考慮します。推論レイテンシーはモデルによって異なり、その時点でのすべての顧客による入力トークンと出力トークンの数、および進行中のオンデマンドリクエストの合計数に直接比例します。スループットが保証されるように、プロビジョンドスループット を試すことをお勧めします。
モデル | 1 分あたりに処理されるリクエスト数 | 1 分あたりに処理されるトークン数 | リージョン | Service Quotas で調整可能 |
---|---|---|---|---|
AI21 Labs Jurassic-2 Mid | 400 | 300,000 | us-east-1 | なし |
AI21 Labs Jurassic-2 Ultra | 100 | 300,000 | すべて | なし |
AI21 Jamba-Instruct | 100 | 300,000 | すべて | なし |
Amazon Titan Text Embeddings V1 | 2,000 | 300,000 | すべて | なし |
Amazon Titan Text Embeddings V2 | 2,000 | 300,000 | すべて | なし |
Amazon Titan Image Generator G1 V1 | 60 | 該当なし | すべて | なし |
Amazon Titan Image Generator G1 V2 | 60 | 該当なし | すべて | なし |
Amazon Titan Multimodal Embeddings G1 | 2,000 | 300,000 | すべて | なし |
Amazon Titan Text G1 - Express | 400 | 300,000 | すべて | なし |
Amazon Titan Text G1 - Lite | 800 | 300,000 | すべて | なし |
Amazon Titan Text Premier | 100 | 300,000 | すべて | なし |
Anthropic Claude Instant | 1,000 | 1,000,000 |
us-east-1 us-west-2 |
なし |
400 | 300,000 | その他のリージョン | ||
Anthropic Claude 2.x | 500 | 500,000 |
us-east-1 us-west-2 |
なし |
100 | 200,000 件の | その他のリージョン | ||
Anthropic Claude 3 Sonnet | 500 | 1,000,000 |
us-east-1 us-west-2 |
なし |
100 | 200,000 件の | その他のリージョン | ||
Anthropic Claude 3 Haiku | 1,000 | 2,000,000 |
us-east-1 us-west-2 |
なし |
200 | 200,000 件の |
ap-northeast-1 ap-southeast-1 |
||
400 | 300,000 | その他のリージョン | ||
Anthropic Claude 3.5 Sonnet | 250 | 2,000,000 | us-west-2 | なし |
20 | 200,000 件の |
ap-northeast-1 ap-southeast-1 eu-central-1 |
なし | |
50 | 400,000 | その他のリージョン | なし | |
Anthropic Claude 3 Opus | 50 | 400,000 | すべて | なし |
Cohere Command R | 400 | 300,000 | すべて | なし |
Cohere Command R+ | 400 | 300,000 | すべて | なし |
Cohere Command | 400 | 300,000 | すべて | なし |
Cohere Command Light | 800 | 300,000 | すべて | なし |
Cohere Embed (英語) | 2,000 | 300,000 | すべて | なし |
Cohere Embed (多言語) | 2,000 | 300,000 | すべて | なし |
Meta Llama 2 13B | 800 | 300,000 | すべて | なし |
Meta Llama 2 70B | 400 | 300,000 | すべて | なし |
Meta Llama 3 8B Instruct | 800 | 300,000 | すべて | なし |
Meta Llama 3 70B Instruct | 400 | 300,000 | すべて | なし |
Meta Llama 3.1 8B Instruct | 800 | 300,000 | us-west-2 | なし |
Meta Llama 3.1 70B Instruct | 400 | 300,000 | us-west-2 | なし |
Meta Llama 3.1 405B Instruct | 200 | 400,000 | us-west-2 | なし |
Mistral AI Mistral 7B Instruct | 800 | 300,000 | すべて | なし |
Mistral AI Mixtral 8X7B Instruct | 400 | 300,000 | すべて | なし |
Mistral AI Mistral Large | 400 | 300,000 | すべて | なし |
Mistral AI Mistral Large 2 (24.07) | 400 | 300,000 | us-west-2 | なし |
Mistral AI Mistral Small | 400 | 300,000 | すべて | なし |
Stable Diffusion XL | 60 | 該当なし | すべて | なし |
Stable Diffusion 3 | 60 | 該当なし | 米国西部 (オレゴン) (us-west-2) | なし |
Stable Diffusion 3 ラージ | 15 | 該当なし | 米国西部 (オレゴン) (us-west-2) | なし |
安定イメージ Ultra | 10 | 該当なし | 米国西部 (オレゴン) (us-west-2) | なし |
安定した Image Core | 90 | 該当なし | 米国西部 (オレゴン) (us-west-2) | なし |
次の表は、Amazon Bedrock のさまざまなAPIオペレーションで 1 秒あたりに実行できるAPIリクエストの最大数を示しています。
機能 | API オペレーション | 1 秒あたりの最大リクエスト数 |
---|---|---|
該当なし | 会話 | 200 |
ConverseStream | 200 | |
DeleteModelInvocationLoggingConfiguration | 1 | |
GetFoundationModel | 10 | |
GetModelInvocationLoggingConfiguration | 10 | |
InvokeModel | 200 | |
InvokeModelWithResponseStream | 200 | |
ListFoundationModels | 10 | |
ListTagsForResource | 20 | |
PutModelInvocationLoggingConfiguration | 1 | |
TagResource | 20 | |
UntagResource | 20 | |
エージェント | AssociateAgentKnowledgeBase | 6 |
CreateAgent | 6 | |
CreateAgentActionGroup | 12 | |
CreateAgentAlias | 2 | |
DeleteAgent | 2 | |
DeleteAgentActionGroup | 2 | |
DeleteAgentAlias | 2 | |
DeleteAgentVersion | 2 | |
DisassociateAgentKnowledgeBase | 4 | |
GetAgent | 15 | |
GetAgentActionGroup | 20 | |
GetAgentAlias | 10 | |
GetAgentKnowledgeBase | 15 | |
GetAgentVersion | 10 | |
ListAgents | 10 | |
ListAgentActionGroups | 10 | |
ListAgentAliases | 10 | |
ListAgentKnowledgeBases | 10 | |
ListAgentVersions | 10 | |
PrepareAgent | 2 | |
UpdateAgent | 4 | |
UpdateAgentActionGroup | 6 | |
UpdateAgentAlias | 2 | |
UpdateAgentKnowledgeBase | 4 | |
カスタムモデル | CreateModelCustomizationJob | 1 |
DeleteCustomModel | 10 | |
GetCustomModel | 10 | |
GetModelCustomizationJob | 10 | |
ListModelCustomizationJobs | 10 | |
StopModelCustomizationJob | 10 | |
ガードレール | CreateGuardrail | 1 |
CreateGuardrailVersion | 1 | |
DeleteGuardrail | 1 | |
GetGuardrail | 10 | |
ListGuardrails | 10 | |
UpdateGuardrail | 1 | |
ナレッジベース | CreateDataSource | 2 |
CreateKnowledgeBase | 2 | |
DeleteDataSource | 2 | |
DeleteKnowledgeBase | 2 | |
GetDataSource | 10 | |
GetIngestionJob | 10 | |
GetKnowledgeBase | 10 | |
ListDataSources | 10 | |
ListIngestionJobs | 10 | |
ListKnowledgeBases | 10 | |
Retrieve | 5 | |
RetrieveAndGenerate | 5 | |
StartIngestionJob | 0.1 | |
UpdateDataSource | 2 | |
UpdateKnowledgeBase | 2 | |
モデル評価 | CreateEvaluationJob | 5 |
GetEvaluationJob | 10 | |
ListEvaluationJobs | 10 | |
StopEvaluationJob | 5 | |
プロビジョンドスループット | CreateProvisionedModelThroughput | 1 |
DeleteProvisionedModelThroughput | 1 | |
GetProvisionedModelThroughput | 10 | |
ListProvisionedModelThroughputs | 10 | |
UpdateProvisionedModelThroughput | 1 |
タブを選択すると、プロンプトのモデル固有のクォータが表示されます。
バッチ推論を実行する場合、次のクォータが適用されます。
クォータ | 最大値 | Service Quotas で調整可能 | 説明 |
---|---|---|---|
ベースモデルの同時バッチ推論ジョブ | 3 | あり | ベースモデルで進行中のバッチ推論ジョブの最大数。 |
カスタムモデルの同時バッチ推論ジョブ | 3 | あり | カスタムモデルで進行中のバッチ推論ジョブの最大数。 |
バッチ推論入力ファイルあたりのレコード | 50,000 | あり | バッチ推論ジョブの入力ファイルに含めることができるレコードの最大数。 |
バッチ推論ジョブあたりのレコード | 50,000 | あり | バッチ推論ジョブに含めることができるレコードの最大数。 |
バッチ推論ジョブあたりの最小レコード数 | 1,000 | なし | バッチ推論ジョブに含めることができるレコードの最小数。 |
バッチ推論入力ファイルサイズ | 200 MB | あり | バッチ推論用に送信された 1 つのファイルの最大サイズ (バイト単位)。 |
バッチ推論ジョブのサイズ | 1 GB | あり | バッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ。 |
ガードレールを使用する場合、次のクォータが適用されます。
クォータ | 説明 | 値 |
---|---|---|
アカウントあたりのガードレール | アカウント内のガードレールの最大数。 | 100 |
ガードレールあたりのバージョン | ガードレールが保持できるバージョンの最大数。 | 20 |
トピックガードレールあたりのトピック | ガードレールトピックポリシー全体で定義できるトピックの最大数。 | 30 |
トピックあたりのフレーズの例 | トピックに含めることができるトピック例の最大数。 | 5 |
機密情報フィルターの正規表現 | 機密情報ポリシーに含めることができるガードレールフィルター正規表現の最大数 | 10 |
正規表現の文字数 | ガードレールフィルター正規表現の最大長。文字単位。 | 500 |
Word ポリシーあたりの単語 | ブロックされた単語リストに含めることができる単語の最大数。 | 10,000 |
文字単位の単語長 | ブロックされた単語リスト内の単語の最大長。文字単位。 | 100 |
オンデマンド ApplyGuardrail リクエスト/秒 | 1 秒あたりに ApplyGuardrail API実行できる呼び出しの最大数。 | 25 |
オンデマンド ApplyGuardrail で拒否されたトピックポリシーのテキスト単位/秒。 | 拒否されたトピックポリシーで処理できる 1 秒あたりのテキストユニットの最大数。 | 25 |
オンデマンド ApplyGuardrail コンテンツフィルターポリシーのテキスト単位/秒 | コンテンツフィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数。 | 25 |
オンデマンド ApplyGuardrail Word フィルターポリシーのテキスト単位/秒 | Word フィルターポリシーで処理できる 1 秒あたりのテキスト単位の最大数。 | 25 |
オンデマンド ApplyGuardrail の機密情報フィルターポリシーのテキスト単位/秒 | 機密情報フィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数。 | 25 |
注記
テキスト単位は最大 1,000 文字です
Amazon Bedrock ナレッジベースには、次のクォータが適用されます。
説明 | 最大値 | Service Quotas で調整可能 | 説明 |
---|---|---|---|
リージョンごとのアカウントあたりのナレッジベース | 100 | なし | アカウントあたりのナレッジベースの最大数。 |
ナレッジベースあたりのデータソース | 5 | なし | ナレッジベースあたりのデータソースの最大数。 |
データソースチャンクサイズ (Titan テキスト G1 - 埋め込み) | 8,192 | なし | を使用したデータソースの最大サイズ (KB) Titan Embeddings G1 - Text. |
データソースチャンクサイズ (Cohere Embed 英語) | 512 | なし | を使用したデータソースの最大サイズ (KB) Cohere Embed 英語。 |
データソースチャンクサイズ (Cohere Embed 多言語) | 512 | なし | を使用したデータソースの最大サイズ (KB) Cohere Embed 多言語。 |
チャンクあたりのデータソースメタデータフィールド/属性の合計。 | 250 | なし | チャンクあたりのドキュメントメタデータフィールド/属性の最大数。 |
Web Crawler のデータソースクロールされたコンテンツ項目の合計数 | 25,000 | なし | クロールできるウェブページコンテンツ項目の最大数 (コンテンツ項目あたり最大 50 MB)。 |
データソースのクロールされたファイルの合計数 | 250 万 | なし | クロールできるデータソースファイルまたはコンテンツ項目の最大数 (ファイル/コンテンツ項目あたり最大 50 MB)。 |
高度な解析の合計データサイズ | 100 MB | なし | 高度な解析を使用して解析できるデータの最大結合サイズ (MB)。 |
合計ファイルの高度な解析 | 100 | なし | 高度な解析を使用して解析できるファイルの最大数。 |
取り込みジョブごとに追加または更新するファイル | 5,000,000 | なし | 取り込みジョブごとに取り込むことができる新規および更新されたファイルの最大数。 |
取り込みジョブごとに削除するファイル | 5,000,000 | なし | 取り込みジョブごとに削除できるファイルの最大数。 |
取り込みジョブファイルサイズ (ソースドキュメント) | 50 MB | なし | 取り込みジョブのソースドキュメントファイルの最大サイズ (MB)。 |
取り込みジョブファイルのサイズ (メタデータファイル) | 10 KB | なし | 取り込みジョブ内のメタデータファイルの最大サイズ (KB)。 |
取り込みジョブのサイズ | 100 GB | なし | 取り込みジョブの最大サイズ (GB 単位)。 |
データソースあたりの同時取り込みジョブ | 1 | なし | データソースに対して同時に実行できる取り込みジョブの最大数。 |
ナレッジベースあたりの同時取り込みジョブ | 1 | なし | ナレッジベースで同時に実行できる取り込みジョブの最大数。 |
アカウントあたりの同時取り込みジョブ | 5 | なし | アカウントで同時に実行できる取り込みジョブの最大数。 |
ユーザークエリサイズ | 1,000 | なし | ユーザークエリの最大サイズ (文字単位)。 |
Amazon Bedrock エージェントには、次のクォータが適用されます。
クォータ | 最大値 | Service Quotas で調整可能 | 説明 |
---|---|---|---|
アカウントあたりのエージェント | 50 | あり | 1 つのアカウント内のエージェントの最大数。 |
エージェントあたりの関連付けられたエイリアス | 10 | なし | エージェントに関連付けることができるエイリアスの最大数。 |
エージェント指示書の文字 | 4,000 | あり | エージェントの指示の最大文字数。 |
エージェントあたりのアクショングループ | 20 | あり | エージェントに追加できるアクショングループの最大数。 |
エージェントごとに有効になっているアクショングループ | 11 | あり | エージェントで有効にできるアクショングループの最大数。 |
APIs エージェントあたりの または 関数 | 11 | あり | エージェントに追加APIsできる の最大数。 |
関数あたりのパラメータ | 5 | あり | アクショングループの関数に追加できるパラメータの最大数。 |
Lambda レスポンスペイロードサイズ | 25 KB | なし | アクショングループ Lambda レスポンスのペイロードの最大サイズ。 |
エージェントあたりの関連付けられたナレッジベース | 2 | あり | エージェントに関連付けることができるナレッジベースの最大数。 |
プロンプト管理には、次のクォータが適用されます。
クォータ | 最大値 | Service Quotas で調整可能 | 説明 |
---|---|---|---|
アカウントあたりのプロンプト | 50 | なし | アカウントで保持できるプロンプト管理のプロンプトの最大数。 |
プロンプトあたりのバージョン | 10 | なし | プロンプト管理のプロンプトに含めることができるバージョンの最大数。 |
プロンプトフローには、次のクォータが適用されます。
クォータ | 最大値 | Service Quotas で調整可能 | 説明 |
---|---|---|---|
アカウントあたりのプロンプトフロー | 10 | なし | アカウントに含めることができるプロンプトフローの最大数。 |
プロンプトフローあたりのノード | 20 | なし | プロンプトフローに含めることができるノードの最大数。 |
プロンプトフローあたりのバージョン | 10 | なし | プロンプトフローが保持できるバージョンの最大数。 |
プロンプトフローあたりのエイリアス | 10 | なし | プロンプトフローに関連付けることができるエイリアスの最大数。 |
アカウントあたりのプロンプトフロー | 10 | なし | アカウントに含めることができるプロンプトフローの最大数。 |
アカウントあたりのプロンプトフロー | 10 | なし | アカウントに含めることができるプロンプトフローの最大数。 |
プロンプトフローあたりのフロー入力ノード | 1 | なし | プロンプトフローに追加できるフロー入力ノードの最大数。 |
プロンプトフローあたりのフロー出力ノード | 5 | なし | プロンプトフローに追加できるフロー出力ノードの最大数。 |
プロンプトフローあたりの条件ノード | 5 | なし | プロンプトフローに追加できる条件ノードの最大数。 |
プロンプトフローあたりのイテレーターノード | 1 | なし | プロンプトフローに追加できるイテレーターノードの最大数。 |
プロンプトフローあたりのコレクターノード | 1 | なし | プロンプトフローに追加できるコレクターノードの最大数。 |
プロンプトフローあたりのプロンプトノード | 5 | なし | プロンプトフローに追加できるプロンプトノードの最大数。 |
プロンプトフローあたりの Lambda ノード | 5 | なし | プロンプトフローに追加できる Lambda ノードの最大数。 |
プロンプトフローあたりの Lex ノード | 5 | なし | プロンプトフローに追加できる Lex ノードの最大数。 |
プロンプトフローあたりのノードタイプあたりのノード数 | 5 | なし | プロンプトフローの各タイプに追加できるノードの最大数。 |
条件ノードあたりの条件 | 5 | なし | プロンプトフローで条件ノードに追加できる条件の最大数。 |
モデルカスタマイズには、次のクォータが適用されます。
説明 | 最大値 | Service Quotas で調整可能 |
---|---|---|
アカウントでインポートされたモデルの最大数。 | 3 | あり |
スケジュールされたカスタマイズジョブの最大数。 | 2 | なし |
アカウント内のカスタムモデルの最大数。 | 100 | あり |
ハイパーパラメータクォータを確認するには、「」を参照してくださいカスタムモデルのハイパーパラメータ。
タブを選択すると、さまざまな基盤モデルのカスタマイズに使用されるトレーニングデータセットと検証データセットに適用されるモデル固有のクォータが表示されます。
プロビジョンドスループットには以下のクォータが適用されます。
注記
クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォーム
説明 | デフォルト | Service Quotas で調整可能 |
---|---|---|
コミットなしのプロビジョンドスループットに分散できるモデルユニット | 2 | なし |
コミットメントでプロビジョンドスループット全体に分散できるモデルユニット | 0 | なし |
モデル評価ジョブには、次のクォータが適用されます。
ジョブタイプ | 説明 | デフォルト | 引き上げ可能 |
---|---|---|---|
自動化 |
自動モデル評価ジョブで指定できるデータセットの最大数。これには、カスタムプロンプトデータセットと組み込みプロンプトデータセットの両方が含まれます。 |
5 | なし |
自動化 |
自動モデル評価ジョブでデータセットごとに指定できるメトリクスの最大数。これには、カスタムメトリクスと組み込みメトリクスの両方が含まれます。 |
3 | なし |
Human |
ヒューマンワーカーを使用するモデル評価ジョブで指定できるカスタムメトリクスの最大数。 |
10 | なし |
自動化 |
自動モデル評価ジョブで指定できるモデルの最大数。 |
1 | なし |
Human |
ヒューマンワーカーを使用するモデル評価ジョブで指定できるモデルの最大数。 |
2 | なし |
自動化 |
現在のリージョンで、このアカウントで一度に指定できる自動モデル評価ジョブの最大数。 |
20 | なし |
Human |
現在のリージョンで、このアカウントで一度に指定できるヒューマンワーカーを使用するモデル評価ジョブの最大数。 |
10 | なし |
両方 |
このアカウントで現在のリージョンに作成できるモデル評価ジョブの最大数。 |
500 | なし |
Human |
現在のリージョンで、このアカウントのヒューマンベースモデル評価ジョブで指定できるカスタムプロンプトデータセットの最大数。 |
1 | なし |
両方 |
カスタムプロンプトデータセットに含めることができるプロンプトの最大数。 |
1,000 | なし |
両方 |
個々のプロンプトの最大サイズ (KB 単位) は、カスタムプロンプトデータセットです。 |
4 KB | なし |
Human |
ワーカーがタスクを完了するために必要な最大時間 (日数)。 |
30 | いいえ |