ガイドラインとクォータ - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ガイドラインとクォータ

ここに示す Amazon Comprehend のクォータの多くは、アプリケーションで必要に応じて増やすことができます。サービスクォータ、およびクォータの増加をリクエストする方法については、「」を参照してください。AWS のサービスクォータ

Amazon Comprehend を使用するときは、以下の情報を覚えておいてください。

サポートされているリージョン

Amazon Comprehend を使用できる AWS リージョンのリストについては、「」を参照してください。AWS リージョンとエンドポイントAmazon Web Services 全般リファレンス

全体的なクォータ

非同期オペレーションおよびトピックモデリング操作を除くすべてのオペレーションには以下のクォータがあります。

説明 クォータ/ガイドライン
文字エンコーディング UTF-8
ドキュメントサイズ (UTF-8 文字) 5,000 バイト

PII を使用してドキュメントにラベルを付ける同期要求ContainsPiiEntitiesオペレーションには以下のクォータがあります。

説明 クォータ/ガイドライン
文字エンコーディング UTF-8
ドキュメントサイズ (UTF-8 文字) 50,000 バイト

Amazon Comprehend では、分析モデルの品質を継続的に向上させるため、コンテンツを保存する場合があります。フレームワークの使用の詳細については、Amazon Comprehend よくある質問詳細を参照してください。

単一トランザクションを使用する場合のスロットル

単一のトランザクション操作ではなくバッチ操作を使用すると、スロットリングを回避できます。詳細については、「複数ドキュメントの操作」を参照してください。

複数ドキュメントの操作

-BatchDetectDominantLanguage,BatchDetectEntities,BatchDetectKeyPhrases, およびBatchDetectSentimentオペレーションには以下のクォータがあります。

説明 クォータ/ガイドライン
リクエストごとのドキュメント 25

毎秒 20 を超えるリクエストを送信する場合は、バッチオペレーションの使用を検討する必要があります。Batch 操作を使用すると、各リクエストでより多くのドキュメントを送信できるため、スループットが高くなる可能性があります。たとえば、でDetectDominantLanguageオペレーションでは、毎秒最大 20 ドキュメントを送信できます。ただし、BatchRequestDominantLanguage操作すると、毎秒250ドキュメントまで送信できますが、処理速度は低下する可能性があります。クォータのスロットリングの詳細については、「」を参照してください。Amazon Comprehend Quotas ComprehAmazon Web Services 全般リファレンス。マルチドキュメント API の使用方法の詳細については、「」を参照してください。複数ドキュメントの同期処理

非同期オペレーション

非同期バッチジョブは、StartDominantLanguageDetectionJob,StartEntitiesDetectionJob,StartKeyPhrasesDetectionJob,StartPiiEntitiesDetectionJob, およびStartSentimentDetectionJobオペレーション. これらのジョブには以下の制限があります。

説明 クォータ/ガイドライン
エンティティ、キーフレーズ、PII、および言語を検出するジョブ内の各ドキュメントの最大サイズ 1 MB
センチメントを検出するジョブ内の各ドキュメントの最大サイズ 5KB
バッチ内のすべてのファイルの合計サイズ 5 GB
ファイルの最大数、ファイルごとに 1 ドキュメントを 1 つ 1,000,000

非同期操作を使用する必要があります。

  • 25 を超えるドキュメントを一度に分析するには

  • 5,000 バイトを超えるドキュメントをキーワードとエンティティについて分析するには

詳細については、「非同期バッチ処理」を参照してください。

ドキュメントの分類

ドキュメント分類子トレーニングジョブはCreateDocumentClassifier操作、非同期ドキュメント分類ジョブはStartDocumentClassificationJob、同期文書分類要求はClassifyDocumentオペレーションには以下の制限があります。

General
説明 クォータ/ガイドライン
文字エンコーディング UTF-8
クラスの最大数 (マルチクラスモード) 1,000
クラスの最大数 (マルチラベルモード) 100
クラス名の最大長 5,000 文字
クラスあたりのトレーニングドキュメントの最小数(マルチクラスモード) 50
クラスごとのトレーニングドキュメントの最小数(マルチラベルモード) 10
トレーニングジョブのすべてのファイルの合計サイズ 5 GB
非同期ジョブのすべてのファイルの合計サイズ 5 GB
1 つのファイルの最大ファイルサイズ、1 ファイルにつき 1 つのドキュメント 10 MB
ファイルの最大数、ファイルごとに 1 ドキュメントを 1 つ 1,000,000
最大行数、1 行につき 1 つのドキュメント (リクエスト中のすべてのファイルについて) 1,000,000
同期リクエストあたりのドキュメントの最大数 1
カスタム分類器を学習するための拡張マニフェストファイルの最大数 5
各拡張マニフェストファイルの属性名の最大数 5
属性名の最大長 63 文字
リアルタイム分析
説明 クォータ/ガイドライン
アカウントあたりの推論ユニットの最大数 100
エンドポイントあたりの推論単位の最大数 10
推論単位 (文字) あたりの最大スループット 100/秒
推論ユニットあたりの最大スループット (ドキュメント) 2/秒

言語検出

-BatchDetectDominantLanguage,DetectDominantLanguageオペレーションと非同期ジョブはStartDominantLanguageDetectionJobオペレーションには以下の制限事項があります。

  • 彼らは音声言語検出をサポートしていません。たとえば、「アリガト」を日本人として検出し、中国語の「nihao」は検出しません。

  • インドネシア語やマレー語、ボスニア語、クロアチア語、セルビア語など、近い言語のペアを区別するのに問題があるかもしれません。

  • 最良の結果を得るには、入力テキストは 20 文字以上にする必要があります。

Events

で作成されたイベント検出ジョブStartEventsDetectionJobオペレーションには以下の制限があります。

説明 クォータ
文字エンコーディング UTF-8
ジョブのすべてのファイルの合計サイズ 50 MB
ジョブの各ドキュメントの最大サイズ 10 KB
ファイルの最大数、ファイルごとに 1 ドキュメントを 1 つ 5,000
最大行数、1 行につき 1 つのドキュメント (リクエスト中のすべてのファイルについて) 5,000

トピックモデリング

を使用して作成されたトピック検出ジョブStartTopicsDetectionJobオペレーションには以下の制限があります。

説明 クォータ/ガイドライン
文字エンコーディング UTF-8
返されるトピックの最大数 100
リクエストのすべてのファイルの最大合計サイズ 5 GB
リクエストのすべてのファイルの最小合計サイズ 500 バイト
1 つのファイルの最大ファイルサイズ、1 ファイルにつき 1 つのドキュメント 100 MB
ファイルの最大数、ファイルごとに 1 ドキュメントを 1 つ 1,000,000
最大行数、1 行につき 1 つのドキュメント (リクエスト中のすべてのファイルについて) 1,000,000

最良の結果を得るには、少なくとも 1,000 個の入力ドキュメントを含める必要があります。

エンティティ認識

エンティティレコグナイザのトレーニングジョブは、CreateEntityRecognizer操作、非同期エンティティ認識ジョブはStartEntitiesDetectionJob操作、および同期エンティティ認識要求はDetectEntitiesオペレーションには以下の制限があります。

プレーンテキストエンティティ認識-トレーニング (CreateEntityRecognizer)
説明 クォータ/ガイドライン
モデルあたりのエンティティ数/カスタムエンティティ認識機能 1-25
ドキュメントサイズ (UTF-8) 1-5,000 バイト
ドキュメントの数 250-12,000
ドキュメントコーパスサイズ (プレーンテキストのすべてのドキュメントを組み合わせて) 5キロバイト-100MB
エンティティあたりのアノテーションの最小数 100
エンティティリストの項目数 1-100 万件
エントリリスト内の個々のエントリ(ポストストリップ)の長さ 1-5,000
エンティティリストコーパスサイズ (プレーンテキストのすべてのドキュメントを組み合わせ) 5KB-100メガバイト
PDF または Word テキストエンティティ認識-トレーニング (CreateEntityRecognizer)
説明 クォータ/ガイドライン
モデルあたりのエンティティ数/カスタムエンティティ認識機能 1-25
アノテーションファイルの最大サイズ (UTF-8 JSON) 5 MB
ドキュメントの数 250-10,000
ドキュメントコーパスサイズ (プレーンテキストのすべてのドキュメントを組み合わせて) 5 KB-1 GB
エンティティあたりのアノテーションの最小数 100
拡張マニフェストファイル
説明 クォータ/ガイドライン
カスタムエンティティ認識機能をトレーニングするための拡張マニフェストファイルの最大数 5
各拡張マニフェストファイルの属性名の最大数 5
属性名の最大長 63 文字
プレーンテキストエンティティ認識-推論 (StartEntitiesDetectionJob)
説明 クォータ/ガイドライン
ドキュメントサイズ (UTF-8) 1 バイト-1 MB
ファイルの最大数、ファイルごとに 1 ドキュメントを 1 つ 1,000,000
最大行数、1 行につき 1 つのドキュメント (リクエスト中のすべてのファイルについて) 1,000,000
ドキュメントコーパスサイズ (プレーンテキストのすべてのドキュメントを組み合わせて) 1バイト-5ギガバイト
PDF または Word テキストエンティティ認識-推論 (StartEntitiesDetectionJob)
説明 クォータ/ガイドライン
ドキュメントサイズ (PDF) 1バイト-50メガバイト
ドキュメントサイズ (docx) 1 バイト-5 MB
ドキュメントサイズ (UTF-8) 1 バイト-1 MB
ファイルの最大数、ファイルごとに 1 つのドキュメント (PDF または Word ドキュメントでは 1 行につき 1 つのドキュメントは使用できません) 500
単一の PDF または docx ファイルの最大ページ数 100
ドキュメントコーパスサイズ (プレーンテキストのすべてのドキュメントを組み合わせて) 1バイト-5ギガバイト
リアルタイム分析
説明 クォータ/ガイドライン
アカウントあたりの推論ユニットの最大数 100
エンドポイントあたりの推論単位の最大数 10
推論単位 (文字) あたりの最大スループット 100/秒
推論ユニットあたりの最大スループット (ドキュメント) 2/秒
同期リクエストあたりのドキュメントの最大数 1