Amazon Comprehend とは - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Comprehend とは

Amazon Comprehend では、自然言語処理 (NLP) を使用して、ドキュメントの内容に関するインサイトを抽出します。Amazon Comprehend は、UTF-8 形式のテキストファイルと、PDF や Word ドキュメントなどの半構造化ドキュメントを処理します。ドキュメント内のエンティティ、キーフレーズ、言語、感情、その他の共通要素を認識することでインサイトを作り上げます。Amazon Comprehend を使用して、ドキュメントの構造の理解に基づいて新しい商品を作成します。たとえば、Amazon Comprehend を使用すると、ソーシャルネットワーキングフィードで製品のメンションを検索したり、ドキュメントリポジトリ全体をスキャンしてキーフレーズを検索したりできます。

一度に 1 つ以上のドキュメントを操作して、ドキュメントの内容を評価し、そのドキュメントに関する洞察を得ます。Amazon Comprehend がドキュメントについて開発するインサイトには、次のようなものがあります。

  • エンティティ— Amazon Comprehend は、ドキュメント内で識別された人物、場所、場所などのエンティティのリストを返します。詳細については、「エンティティを検出する」を参照してください。

  • キーフレーズ— Amazon Comprehend は、ドキュメントに表示されるキーフレーズを抽出します。たとえば、バスケットボールの試合に関するドキュメントは、チームの名前、会場の名前、最終スコアを返すことができます。詳細については、「キーフレーズの検出」を参照してください。

  • PII— Amazon Comprehend は、文書を分析して、住所、銀行口座番号、電話番号など、個人を特定するために使用できる個人データを検出します。詳細については、「PII (個人識別情報) を検出する」を参照してください。

  • 言語— Amazon Comprehend は、ドキュメント内の主要な言語を識別します。Amazon Comprehend は 100 の言語を識別できます。詳細については、「主要な言語を検出する」を参照してください。

  • 感情— Amazon Comprehend は、ドキュメントの感情的な感情を決定します。感情は、ポジティブ、中立、ネガティブ、または混合のいずれかになります。詳細については、「感情を決定する」を参照してください。

  • 構文— Amazon Comprehend は、ドキュメント内の各単語を解析し、その単語の品詞を決定します。例えば、「シアトルでは今日雨が降っている」という文では、「それ」は代名詞として、「雨」は動詞として、「シアトル」は固有名詞として識別される。詳細については、「構文の分析」を参照してください。

カスタムComprehend する

機械学習ベースのNLPソリューションを構築するために必要なスキルセットなしで、特定の要件に合わせてComprehendをカスタマイズできます。自動機械学習 (AutoML) を使用して、Comprehend Custom は、すでに持っているデータを使用して、カスタマイズされた NLP モデルをお客様に代わって構築します。

カスタム分類: カスタムドキュメント分類子を作成して、ドキュメントを独自のカテゴリに整理します。各分類ラベルについて、そのラベルを最もよく表す一連のドキュメントを提供し、そのラベルで分類器を学習させます。学習が完了すると、分類子は任意の数のラベル付けされていない文書セットで使用できます。コンソールを使用してコードフリーで操作することも、最新の AWS SDK をインストールすることもできます。詳細については、「カスタム分類」を参照してください。

カスタムエンティティ: 特定の用語や名詞ベースのフレーズのテキストを分析するカスタムエンティティタイプを作成します。カスタムエンティティをトレーニングして、ポリシー番号や顧客のエスカレーションを意味するフレーズなどの用語を抽出できます。モデルをトレーニングするには、エンティティのリストと、エンティティを含むドキュメントのセットを指定します。モデルのトレーニングが完了したら、モデルに対して解析ジョブを送信して、ユーザー定義エンティティを抽出できます。詳細については、「カスタムエンティティ認識」を参照してください。

ドキュメントクラスタリング (トピックモデリング)

Amazon Comprehend を使用して、ドキュメントのコーパスを調べて、ドキュメント内の類似キーワードに基づいて整理することもできます。ドキュメントクラスタリング(トピックモデリング)は、ドキュメント内の単語の頻度に基づいて類似するトピックまたはクラスタに大量のドキュメントを整理する場合に便利です。

トピックモデリングは非同期プロセスであり、処理のために一連のドキュメントを送信し、処理が完了したときに後で結果を取得します。Amazon Comprehend は、大きなドキュメントセットでトピックモデリングを行います。最良の結果を得るには、トピックモデリングジョブを送信するときに 1,000 以上のドキュメントを含める必要があります。詳細については、「トピックモデリング」を参照してください。

Examples

以下の例では、Amazon Comprehend オペレーションをアプリケーションで使用する方法を示します。

例 1: 件名に関する文書を検索する

Amazon Comprehend トピックモデリングを使用して、特定のテーマに関するドキュメントを検索します。一連のドキュメントをスキャンして、議論されたトピックを特定し、各トピックに関連付けられているドキュメントを検索します。Amazon Comprehend がドキュメントセットから返すトピックの数を指定できます。

例 2: 顧客があなたの製品についてどのように感じているかを調べる

会社がカタログを公開している場合は、Amazon Comprehend に、購入者が商品についてどう考えているか教えてもらいます。各カスタマーコメントをDetectSentiment操作ができ、顧客が製品について肯定的、否定的、中性、または混在しているかどうかを教えてくれます。

例 3: 顧客にとって重要なものを発見する

Amazon Comprehend トピックモデリングを使用して、顧客がフォーラムや掲示板で話しているトピックを検出し、エンティティ検出を使用して、トピックに関連付けられている人、場所、およびものを特定します。最後に、センチメント分析を使用して、顧客がトピックについてどのように感じているかを判断します。

Benefits

Amazon Comprehend を使用するメリットには次のようなものがあります。

  • 強力な自然言語処理をアプリに統合する— Amazon Comprehend では、強力で正確な自然言語処理をシンプルな API で利用可能にすることで、テキスト分析機能をアプリケーションに簡単に組み込むことができます。Amazon Comprehend が生成するインサイトを利用するために、テキスト分析の専門知識は必要ありません。

  • 深層学習ベースの自然言語処理—Amazon Comprehend は、ディープラーニングテクノロジーを使用してテキストを正確に分析します。当社のモデルは、精度を向上させるために、複数のドメインにわたって新しいデータを使用して常にトレーニングされています。

  • スケーラブルな自然言語処理—Amazon Comprehend では、何百万ものドキュメントを分析して、ドキュメントに含まれるインサイトを発見できます。

  • 他の AWS のサービスと統合する— Amazon Comprehend は Amazon S3 などの他の AWS サービスとシームレスに連携するように設計されています。AWS KMS, およびAWS Lambda。Amazon S3 にドキュメントを保存するか、Kinesis Data Firehose でリアルタイムデータを分析します。サポート対象AWS Identity and Access Management(IAM) では、Amazon Comprehend オペレーションへのアクセスの安全な制御が容易になります。IAM を使用して、AWS のユーザーやグループを作成および管理し、開発者やエンドユーザーに適切なアクセス権を付与できます。

  • 出力結果とボリュームデータの暗号化—Amazon S3 ではすでに入力ドキュメントを暗号化でき、Amazon Comprehend はこれをさらに拡張しています。独自の KMS キーを使用すると、ジョブの出力結果だけでなく、分析ジョブを処理するコンピューティングインスタンスにアタッチされたストレージボリューム上のデータも暗号化できます。その結果、セキュリティが大幅に強化されます。

  • 低コスト— Amazon Comprehend では、分析したドキュメント分のみお支払いいただくだけでご利用いただけます。最低料金や前払いの義務はありません。

Amazon Comprehend を初めてお使いになる方向けの情報

Amazon Comprehend を初めて使用する方には、次のセクションを順に読むことをお勧めします。

  1. 仕組み— このセクションでは、Amazon Comprehend の概念を紹介します。

  2. Amazon Comprehend の開始方法— このセクションでは、アカウントをセットアップして Amazon Comprehend をテストします。

  3. API リファレンス — このセクションでは、Amazon Comprehend オペレーションのリファレンスドキュメントについて説明します。