Amazon Comprehend とは - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Comprehend とは

Amazon Comprehend では自然言語処理 (NLP)を使用して、ドキュメントの内容に関するインサイトを抽出します。ドキュメント内のエンティティ、キーフレーズ、言語、感情、その他の共通要素を認識することでインサイトを作り上げます。Amazon Comprehend を利用することで、ドキュメントの構造を理解して新しい製品を作成できます。たとえば、Amazon Comprehend してソーシャルネットワーキングフィードから製品に関するメンションを検索したり、ドキュメントリポジトリ全体をスキャンしてキーフレーズを探し出したりできます。

Amazon Comprehend のドキュメント分析機能には、Amazon Comprehend コンソールまたは Amazon Comprehend API を使用してアクセスできます。小規模なワークロードに対してリアルタイムの分析を実行したり、大規模なドキュメントセットに対して非同期の分析ジョブを開始したりできます。Amazon Comprehend が提供するトレーニング済みモデルを使用することも、独自のカスタムモデルをトレーニングして分類やエンティティ認識を行うこともできます。

Amazon Comprehend は、コンテンツを保存して、トレーニング済みモデルの品質を継続的に向上させることができます。詳細については、「Amazon Comprehend FAQ」を参照してください。

Amazon Comprehend のすべての機能は、その入力として UTF-8 テキストドキュメントを受け付けることができます。また、カスタム分類とカスタムエンティティ認識は、その入力として画像ファイル、PDF ファイル、Word ファイルを受け付けることができます。

Amazon Comprehend は、その機能に応じて、さまざまな言語のドキュメントを検査および分析することができます。詳細については、「Amazon Comprehend でサポートされている言語」を参照してください。Amazon Comprehendの 主要言語 機能はドキュメントを検査し、主要言語を判断して、より幅広い言語が選択できるようにします。

Amazon Comprehend のインサイト

Amazon Comprehend では、トレーニング済みモデルを使用して 1 つまたは複数のドキュメントを検査して分析し、インサイトを収集することができます。このモデルは、大量の医療テキストで継続的にトレーニングされるため、トレーニングデータを提供する必要はありません。

Amazon Comprehend は、以下の種類のインサイトを分析します。

  • Entities — ドキュメント内での人物、場所、アイテム、場所への言及 (名前)。

  • Key phrases — ドキュメントに現れるフレーズ。例えば、バスケットボールの試合に関するドキュメントでは、チームの名前、会場の名前、最終スコアを返すことができます。

  • 個人を特定できる情報 (PII) — 住所や銀行口座番号、電話番号など、個人を特定できる個人データ。

  • Language — ドキュメントの主要言語。

  • Sentiment — ドキュメントの主要な感情。肯定的、中立、否定的、混在のいずれからにできます。

  • Targeted sentiment — ドキュメント内の特定のエンティティに関連する感情。出現する各エンティティに対する感情は、肯定的、否定的、中立、混在のいずれかにできます。

  • Syntax — ドキュメント内の各単語の品詞。

詳細については、「インサイト」を参照してください。

Amazon Comprehend Custom

Amazon Comprehend は、機械学習ベースの NLP ソリューションを構築するために必要なスキルを必要とすることなく、お客様それぞれのニーズに合わせてカスタマイズすることができます。Amazon Comprehend Custom は、自動機械学習 (AutoML) を使用して、すでにあるデータを使用して自動的にカスタマイズされた NLP モデルを構築できます。

カスタム分類 — カスタム分類モデル (分類子) を作成して、ドキュメントを専用のカテゴリに整理できます。

カスタムエンティティ認識 — カスタムエンティティ認識モデル(レコグナイザー)を作成し、特定の用語および名詞ベースの語句についてテキストを分析できます。

詳細については、「Amazon Comprehend Custom」を参照してください。

フライホイール

フライホイールを利用すると、時間の経過に伴うカスタムモデルのバージョンのトレーニングと管理のプロセスを簡素化できます。フライホイールは、モデルの新しいバージョンのトレーニングと評価に関連するタスクをオーケストレーションするのに役立ちます。フライホイールは、カスタム分類とカスタムエンティティ認識を行うためのプレーンテキストのカスタムモデルをサポートします。詳細については、「フライホイール」を参照してください。

ドキュメントのクラスタリング (トピックモデリング)

Amazon Comprehend を利用すると、大量のドキュメントを検査し、類似キーワードに基づいてドキュメントを整理することもできます。ドキュメントのクラスタリング (トピックモデリング) は、大量のドキュメントを単語の出現頻度に基づいて類似したトピックまたはクラスターに整理するのに便利です。詳細については、「トピックのモデリング」を参照してください。

以下は、アプリケーションにおける Amazon Comprehend オペレーションの使用例です。

例 1: 1 つの話題に関するドキュメントの検出

Amazon Comprehend トピックモデリングを利用すると、特定の話題に関するドキュメントを検出することができます。一連のドキュメントをスキャンして、扱われているトピックを決定し、各トピックに関連するドキュメントを検出することができます。Amazon Comprehend がドキュメントセットから返すトピックの数を指定できます。

例 2: 商品に関するお客様の感情を特定する

商品カタログを刊行する場合は、お客様がその商品をどのように考えているか、 Amazon Comprehend に調べさせてください。すべてのお客様のコメントを DetectSentiment オペレーションに送信すると、お客様が商品に対して肯定的、否定的、中立、混在のどの感情を持っているか知らせてくれます。

例 3: お客様にとって大切なことを発見する

Amazon Comprehend のトピックモデリングを利用すると、お客様がフォーラムや掲示板で話題にしているトピックを発見し、エンティティ検出を使用して、そのトピックに関連する人物や場所、物を突き止めることができます。  感情分析を利用することで、お客様がトピックに対して抱いている感情を知ることができます。

利点

Amazon Comprehend を使用する利点には、以下のようなものがあります。

  • アプリケーションへの自然言語処理の簡単かつ強力な組み込み — Amazon Comprehend では、シンプルな API を使用して強力で正確な自然言語処理を利用できるようにすることで、アプリケーションにテキスト分析機能を組み込む際の煩雑さを排除します。Amazon Comprehend が生成するインサイトを活用するためのテキスト分析の専門知識は必要ありません。

  • 深層学習ベースの自然言語処理 — Amazon Comprehend は、深層学習テクノロジーを使用してテキストを正確に分析します。精度を向上させるために、複数のドメインにわたって新しいデータを使用して常にモデルがトレーニングされます。

  • スケーラブルな自然言語処理 — Amazon Comprehend では、何百万ものドキュメントを分析して、そこに含まれるインサイトを検出することができます。

  • 他の AWS サービスとの統合 – Amazon Comprehend は、Amazon S3、 AWS KMS、 などの他の AWS サービスとシームレスに連携するように設計されています AWS Lambda。ドキュメントを Amazon S3 に保存するか、Firehose でリアルタイムデータを分析します。 AWS Identity and Access Management (IAM) のサポートにより、Amazon Comprehend オペレーションへのアクセスを安全に制御することが容易になります。IAM を利用して、ユーザーおよびグループを作成・管理し、開発者やエンドユーザーに適切なアクセス権を付与できます。

  • 出力結果とボリュームデータの暗号化 — Amazon S3 はすでに入力ドキュメントを暗号化できるようになっており、Amazon Comprehend ではこの暗号化機能をさらに拡張しています。独自の KMS キーを使用することで、ジョブの出力結果と、分析ジョブを処理するコンピュートインスタンスに追加されたストレージボリューム上のデータを暗号化できます。その結果、セキュリティが大幅に強化されます。

  • 低コスト — Amazon Comprehend では、最低料金や前払いの義務はありません。課金は、分析したドキュメントとトレーニングしたカスタムモデルに対して発生します。

Amazon Comprehend の料金

Amazon Comprehend では、使用したリソースに対して課金が発生するだけです。 AWS の新規のお客様の場合、当初は Amazon Comprehend を無料で利用できます。詳細については、「AWS の無料利用枠」を参照してください。

リアルタイムまたは非同期の分析ジョブの実行には課金が発生します。カスタムモデルのトレーニングやカスタムモデル管理では課金が発生します。カスタムモデルを使用するリアルタイムリクエストでは、エンドポイントを開始してからエンドポイントを削除するまで、エンドポイントに対する課金が発生します。フライホイールの利用に追加料金はかかりません。ただし、フライホイールのイテレーションを実行すると、新しいモデルバージョンのトレーニングとモデルデータの保存に標準料金がかかります。

料金とその他の詳細情報については、「Amazon Comprehend の料金」を参照してください。

Amazon Comprehend は初めてですか ?

Amazon Comprehend を初めてご利用いただく場合は、以下のセクションを順に読むことをお勧めします。

  1. 仕組み — このセクションでは、Amazon Comprehend の概念を説明しています。

  2. セットアップ - このセクションでは、アカウントを作成して、 AWS CLIをセットアップします。

  3. Amazon Comprehend の開始方法 — このセクションでは、Amazon Comprehend 分析ジョブを実行します。

  4. チュートリアル:Amazon Comprehend を使用してカスタマーレビューからインサイトを分析する — このセクションでは、感情とエンティティの分析を行い、結果を可視化します。

  5. Amazon Comprehend API リファレンス — Amazon Comprehend オペレーションのリファレンスドキュメントです。

AWS は、Amazon Comprehend サービスについて学習するための以下のリソースを提供します。