翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Bedrock のクォータ
には、 ごとに、以前 AWS アカウント は制限と呼ばれていたデフォルトのクォータがあります AWS のサービス。特に明記されていない限り、各クォータは 内でリージョン固有です AWS アカウント。一部のクォータは調整可能です。次のリストでは、次の表のService Quotas」列の意味について説明します。
-
クォータが「はい」とマークされている場合は、Service Quotas ユーザーガイド」の「クォータ引き上げのリクエスト」の手順に従って調整できます。
-
クォータが「いいえ」とマークされている場合、次のいずれかの方法でクォータの引き上げをリクエストできる場合があります。
-
オンデマンドランタイムクォータ のクォータ引き上げをリクエストするには、 AWS アカウント マネージャーにお問い合わせください。 AWS アカウント マネージャーがない場合は、現時点ではクォータを増やすことはできません。
-
他のクォータの引き上げをリクエストするには、制限引き上げフォーム
を使用してリクエストを送信し、引き上げを検討します。
注記
圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様には優先順位が付けられます。この条件を満たさない場合、リクエストが拒否される場合があります。
-
一部のクォータはモデルによって異なります。特に明記されていない限り、クォータはモデルのすべてのバージョンに適用されます。
トピックを選択すると、そのクォータの詳細が表示されます。
ランタイムクォータ
レイテンシーはモデルによって異なり、次の条件に直接比例します。
-
入力トークンと出力トークンの数
-
その時点でのすべての顧客による継続的なオンデマンドリクエストの合計数。
モデル推論を実行するときは、以下のクォータが適用されます。これらのクォータは、 InvokeModelおよび InvokeModelWithResponseStreamリクエストの合計を考慮します。
スループットを高めるには、 を購入しますAmazon Bedrock のプロビジョンドスループット。
注記
クォータが Service Quotas で調整できないとマークされている場合は、 AWS アカウント マネージャーに連絡してクォータの引き上げをリクエストできます。 AWS アカウント マネージャーがない場合は、現時点ではクォータを増やすことはできません。圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様には優先順位が付けられます。この条件を満たさない場合、リクエストが拒否される場合があります。
モデル | 1 分あたりに処理されるリクエスト数 | 1 分あたりに処理されるトークン数 | Service Quotas で調整可能 (上の表の注を参照) |
---|---|---|---|
AI21 Labs Jurassic-2 Mid | 400 | 300,000 | いいえ |
AI21 Labs Jurassic-2 Ultra | 100 | 300,000 | いいえ |
Amazon Titan Embeddings G1 - Text | 2,000 | 300,000 | いいえ |
Amazon Titan Image Generator G1 | 60 | 該当なし | いいえ |
Amazon Titan Multimodal Embeddings G1 | 2,000 | 300,000 | いいえ |
Amazon Titan Text G1 - Express | 400 | 300,000 | いいえ |
Amazon Titan Text G1 - Lite | 800 | 300,000 | いいえ |
Amazon Titan Text プレミアム | 100 | 300,000 | いいえ |
Anthropic Claude Instant | 1,000 | 1,000,000 | いいえ |
Anthropic Claude 2.x | 500 | 500,000 | いいえ |
Anthropic Claude 3 Sonnet | 500 | 1,000,000 | いいえ |
Anthropic Claude 3 Haiku | 1,000 | 2,000,000 | いいえ |
Anthropic Claude 3 Opus | 50 | 400,000 | いいえ |
Cohere Command R | 400 | 300,000 | いいえ |
Cohere Command R+ | 400 | 300,000 | いいえ |
Cohere Command | 400 | 300,000 | いいえ |
Cohere Command Light | 800 | 300,000 | いいえ |
Cohere Embed (英語) | 2,000 | 300,000 | いいえ |
Cohere Embed (多言語) | 2,000 | 300,000 | いいえ |
Meta Llama 2 13B | 800 | 300,000 | いいえ |
Meta Llama 2 70B | 400 | 300,000 | いいえ |
Meta Llama 3 8b Instruct | 800 | 300,000 | いいえ |
Meta Llama 3 70b Instruct | 400 | 300,000 | いいえ |
Mistral AI Mistral 7B Instruct | 800 | 300,000 | いいえ |
Mistral AI Mistral Large | 400 | 300,000 | いいえ |
Mistral AI Mixtral 8X7B Instruct | 400 | 300,000 | いいえ |
Stable Diffusion XL | 60 | 該当なし | いいえ |
タブを選択すると、モデル固有の推論クォータが表示されます。
バッチ推論クォータ
バッチ推論を実行するときは、以下のクォータが適用されます。クォータは入出力データのモダリティによって異なります。
注記
クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォーム
モダリティ | 最小ファイルサイズ | 最大ファイルサイズ | Service Quotas で調整可能 (上の表の注を参照) |
---|---|---|---|
テキストから埋め込みへ | 75 MB | 500 MB | いいえ |
テキストからテキストへ | 20 MB | 150 MB | いいえ |
テキスト/画像から画像へ | 1 MB | 50 MB | いいえ |
ナレッジベースのクォータ
Amazon Bedrock のナレッジベースには、次のクォータが適用されます。
注記
クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォーム
説明 | 最大値 | Service Quotas で調整可能 (上の表の注を参照) | 説明 |
---|---|---|---|
アカウントあたりのナレッジベース | 100 | いいえ | アカウントあたりのナレッジベースの最大数。 |
ナレッジベースあたりのデータソース | 5 | いいえ | ナレッジベースあたりのデータソースの最大数。 |
データソースのチャンクサイズ (Titanテキスト G1 - 埋め込み) | 8,192 | いいえ | を使用したデータソースの最大サイズ (KB)Titan Embeddings G1 - Text。 |
データソースチャンクサイズ (CohereEmbed英語) | 512 | いいえ | Cohere Embed 英語を使用したデータソースの最大サイズ (KB)。 |
データソースチャンクサイズ (CohereEmbed多言語) | 512 | いいえ | Cohere Embed 多言語を使用したデータソースの最大サイズ (KB)。 |
取り込みジョブごとに追加または更新するファイル | 5,000,000 | いいえ | 取り込みジョブごとに取り込むことができる新規および更新されたファイルの最大数。 |
取り込みジョブごとに削除するファイル | 5,000,000 | いいえ | 取り込みジョブごとに削除できるファイルの最大数。 |
取り込みジョブファイルサイズ (ソースドキュメント) | 50 MB | いいえ | 取り込みジョブのソースドキュメントファイルの最大サイズ (MB)。 |
取り込みジョブファイルのサイズ (メタデータファイル) | 10 KB | いいえ | 取り込みジョブ内のメタデータファイルの最大サイズ (KB)。 |
取り込みジョブのサイズ | 100 GB | いいえ | 取り込みジョブの最大サイズ (GB 単位)。 |
データソースあたりの同時取り込みジョブ | 1 | いいえ | データソースに対して同時に実行できる取り込みジョブの最大数。 |
ナレッジベースあたりの同時取り込みジョブ | 1 | いいえ | ナレッジベースで同時に実行できる取り込みジョブの最大数。 |
アカウントあたりの同時取り込みジョブ | 5 | いいえ | アカウントで同時に実行できる取り込みジョブの最大数。 |
ユーザークエリサイズ | 1,000 | いいえ | ユーザークエリの最大サイズ (文字単位)。 |
Amazon Bedrock 関連の API リクエストのナレッジベースには、次のスロットリング制限が適用されます。
API オペレーション | 1 秒あたりの最大リクエスト数 | Service Quotas で調整可能 (上の表の注を参照) |
---|---|---|
Retrieve | 5 | いいえ |
RetrieveAndGenerate | 5 | いいえ |
ListKnowledgeBases | 10 | いいえ |
GetKnowledgeBase | 10 | いいえ |
DeleteKnowledgeBase | 2 | いいえ |
UpdateKnowledgeBase | 2 | いいえ |
CreateKnowledgeBase | 2 | いいえ |
ListIngestionJobs | 10 | いいえ |
StartIngestionJob | 0.1 | いいえ |
GetIngestionJob | 10 | いいえ |
ListDataSources | 10 | いいえ |
GetDataSource | 10 | いいえ |
DeleteDataSource | 2 | いいえ |
UpdateDataSource | 2 | いいえ |
CreateDataSource | 2 | いいえ |
エージェントクォータ
Agents for Amazon Bedrock には、次のクォータが適用されます。
注記
クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォーム
クォータ | 最大値 | Service Quotas で調整可能 (上の表の注を参照) | 説明 |
---|---|---|---|
アカウントあたりのエージェント | 50 | はい | 1 つのアカウント内のエージェントの最大数。 |
エージェントあたりの関連付けられたエイリアス | 10 | いいえ | エージェントに関連付けることができるエイリアスの最大数。 |
エージェント指示書の文字 | 4,000 | はい | エージェントの指示の最大文字数。 |
エージェントあたりのアクショングループ | 20 | はい | エージェントに追加できるアクショングループの最大数。 |
エージェントごとに有効になっているアクショングループ | 11 | はい | エージェントで有効にできるアクショングループの最大数。 |
エージェントあたりの APIs または関数 | 11 | はい | エージェントに追加できる APIs の最大数。 |
関数あたりのパラメータ | 5 | いいえ | アクショングループの関数に追加できるパラメータの最大数。 |
Lambda レスポンスペイロードサイズ | 25 KB | いいえ | アクショングループ Lambda レスポンスのペイロードの最大サイズ。 |
エージェントあたりの関連付けられたナレッジベース | 2 | はい | エージェントに関連付けることができるナレッジベースの最大数。 |
次のスロットリング制限は、Amazon Bedrock 関連の API リクエストの エージェントに適用されます。
API オペレーション | 1 秒あたりの最大リクエスト数 | Service Quotas で調整可能 (上の表の注を参照) |
---|---|---|
AssociateAgentKnowledgeBase | 6 | いいえ |
CreateAgent | 6 | いいえ |
CreateAgentActionGroup | 12 | いいえ |
CreateAgentAlias | 2 | いいえ |
DeleteAgent | 2 | いいえ |
DeleteAgentActionGroup | 2 | いいえ |
DeleteAgentAlias | 2 | いいえ |
DeleteAgentVersion | 2 | いいえ |
DisassociateAgentKnowledgeBase | 4 | いいえ |
GetAgent | 15 | いいえ |
GetAgentActionGroup | 20 | いいえ |
GetAgentAlias | 10 | いいえ |
GetAgentKnowledgeBase | 15 | いいえ |
GetAgentVersion | 10 | いいえ |
ListAgents | 10 | いいえ |
ListAgentActionGroups | 10 | いいえ |
ListAgentAliases | 10 | いいえ |
ListAgentKnowledgeBases | 10 | いいえ |
ListAgentVersions | 10 | いいえ |
PrepareAgent | 2 | いいえ |
UpdateAgent | 4 | いいえ |
UpdateAgentActionGroup | 6 | いいえ |
UpdateAgentAlias | 2 | いいえ |
UpdateAgentKnowledgeBase | 4 | いいえ |
モデルカスタマイズのクォータ
モデルカスタマイズには、次のクォータが適用されます。
注記
クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォーム
説明 | 最大値 | Service Quotas で調整可能 (上の表の注を参照) |
---|---|---|
アカウントでインポートされたモデルの最大数。 | 0 | はい |
スケジュールされたカスタマイズジョブの最大数。 | 2 | いいえ |
アカウント内のカスタムモデルの最大数。 | 100 | はい |
ハイパーパラメータクォータを確認するには、「」を参照してくださいカスタムモデルのハイパーパラメータ。
タブを選択すると、さまざまな基盤モデルのカスタマイズに使用されるトレーニングデータセットと検証データセットに適用されるモデル固有のクォータが表示されます。
注記
クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォーム
プロビジョンドスループットのクォータ
プロビジョンドスループットには以下のクォータが適用されます。
注記
クォータが Service Quotas で調整できないとマークされている場合は、制限引き上げフォーム
説明 | デフォルト値 | Service Quotas で調整可能 (上の表の注を参照) |
---|---|---|
コミットなしのプロビジョンドスループットに分散できるモデルユニット | 2 | いいえ |
コミットメントでプロビジョンドスループット全体に分散できるモデルユニット | 0 | いいえ |
モデル評価ジョブのクォータ
モデル評価ジョブには、次のクォータが適用されます。
ジョブタイプ | 説明 | デフォルト | 引き上げ可能 |
---|---|---|---|
自動化 |
自動モデル評価ジョブで指定できるデータセットの最大数。これには、カスタムプロンプトデータセットと組み込みプロンプトデータセットの両方が含まれます。 |
5 | いいえ |
自動化 |
自動モデル評価ジョブでデータセットごとに指定できるメトリクスの最大数。これには、カスタムメトリクスと組み込みメトリクスの両方が含まれます。 |
3 | いいえ |
Human |
ヒューマンワーカーを使用するモデル評価ジョブで指定できるカスタムメトリクスの最大数。 |
10 | いいえ |
自動化 |
自動モデル評価ジョブで指定できるモデルの最大数。 |
1 | いいえ |
Human |
ヒューマンワーカーを使用するモデル評価ジョブで指定できるモデルの最大数。 |
2 | いいえ |
自動化 |
現在のリージョンで、このアカウントで一度に指定できる自動モデル評価ジョブの最大数。 |
20 | いいえ |
Human |
現在のリージョンで、このアカウントで一度に指定できるヒューマンワーカーを使用するモデル評価ジョブの最大数。 |
10 | いいえ |
両方 |
このアカウントで現在のリージョンに作成できるモデル評価ジョブの最大数。 |
500 | いいえ |
Human |
現在のリージョンで、このアカウントのヒューマンベースモデル評価ジョブで指定できるカスタムプロンプトデータセットの最大数。 |
1 | いいえ |
両方 |
カスタムプロンプトデータセットに含めることができるプロンプトの最大数。 |
1,000 | いいえ |
両方 |
個々のプロンプトの最大サイズ (KB 単位) は、カスタムプロンプトデータセットです。 |
4 KB | いいえ |
Human |
ワーカーがタスクを完了するために必要な最大時間 (日数)。 |
30 | いいえ |