構文の分析 - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

構文の分析

を使用する DetectSyntax および BatchDetectSyntax ドキュメントを分析して文書から単語を解析し、文書内の各単語の品詞または構文関数を返す操作。文書の名詞、動詞、形容詞などを識別できます。この情報を使用して、文書の内容をより深く理解し、文書内の単語の関係を理解します。

たとえば、文書内の名詞を検索し、それらの名詞に関連する動詞を探すことができます。「私の祖母は彼女のソファを動かした」のような文章では、名詞の「祖母」と「カウチ」、動詞「動いた」を見ることができます。この情報を使用して、興味のある単語の組み合わせのテキストを分析するアプリケーションを構築できます。

分析を開始するために、Amazon Comprehend はソーステキストを解析して、テキスト内の個々の単語を検索します。テキストが解析された後、ソーステキストに含まれる品詞が各単語に割り当てられます。

Amazon Comprehend は 17 の品詞を識別できます。認識される品詞は次のとおりです。

トークン 品詞の一部
ADJ

形容詞

通常、名詞を変更する単語。

ADP

アドポジション

前置詞句または後置詞句の頭。

ADV

副詞

通常、動詞を変更する単語。形容詞やその他の副詞を変更することもできます。

AUX

補助機能

動詞句の動詞に付随する関数語。

CCONJ

協定世界時

一方を他方に従属させずに単語やフレーズをリンクする単語。

デット

Derminer

特定の名詞句を指定する記事やその他の単語。

INTJ

インタージェクション

感嘆符または感嘆符の一部として使用される単語。

名詞

名詞

人、場所、もの、動物、またはアイデアを指定する言葉。

NUM

Numeral

数を表す単語、通常は決定詞、形容詞、または代名詞です。

O

その他

品詞カテゴリに割り当てられない単語。

PART

粒子

意味を与えるために、別の単語やフレーズに関連付けられた単語を関数化します。

プロン

代名詞

名詞や名詞句に代わる単語。

PROPN

固有名詞

特定の個人、場所、目的の名前である名詞。

突っ込む

句読点

テキストを区切るアルファベット以外の文字。

SCONJ

従属接続詞

文章の一部をもう一方の一部にすることで、文章の一部をリンクする接続詞です。

SYM

記号

ドル記号 ($) や数学記号などの単語に似たエンティティ。

VERB

動詞

イベントやアクションを知らせる言葉。

品詞の詳細については、「」を参照してください。ユニバーサル POS タグユニバーサル依存関係ウェブサイト.

操作は、その単語がテキスト内で表す単語と品詞を識別するトークンを返します。各トークンは、ソーステキスト内の単語を表します。これは、ソース内の単語の位置、その単語がテキスト内で取る品詞、Amazon Comprehend が品詞が正しく識別されたという確信、ソーステキストから解析された単語を提供します。

構文トークンのリストの構造は次のとおりです。ドキュメント内の各単語に対して 1 つの構文トークンが生成されます。

{ "SyntaxTokens": [ { "BeginOffset": number, "EndOffset": number, "PartOfSpeech": { "Score": number, "Tag": "string" }, "Text": "string", "TokenId": number } ] }

各トークンは以下の情報を提供します。

  • BeginOffsetおよびEndOffset入力テキスト内の単語の位置を指定します。

  • PartOfSpeech:2 つの情報を提供します。Tag品詞の特定とScoreこれは、Amazon Comprehend 構文が品詞が正しく識別されたという確信を表しています。

  • Text:識別された単語を提供します。

  • TokenId:トークンの識別子を指定します。識別子は、トークンのリスト内のトークンの位置です。