構文分析 - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

構文分析

構文解析を使用して文書から単語を解析し、文書内の各単語の品詞または構文関数を返します。文書内の名詞、動詞、形容詞などを識別できます。この情報を使用して、ドキュメントの内容をより深く理解し、ドキュメント内の単語の関係を理解します。

たとえば、文書内の名詞を探し、その名詞に関連する動詞を探すことができます。「祖母がソファを動かした」のような文では、「おばあちゃん」と「カウチ」という名詞と、「動かされた」という動詞を見ることができます。この情報を使用して、関心のある単語の組み合わせについてテキストを分析するアプリケーションを構築できます。

分析を開始するために、Amazon Comprehend はソーステキストを解析して、テキスト内の個々の単語を見つけます。テキストが解析されると、各単語にソーステキストに含まれる品詞が割り当てられます。

Amazon Comprehend は、次の品詞を識別できます。

トークン 品詞
ADJ

形容詞

通常、名詞を修正する単語。

ADP

アドポジション

前置詞句または後置詞句の先頭。

ADV

副詞

通常、動詞を変更する単語。また、形容詞やその他の副詞を変更することもあります。

AUX

補助

動詞句の動詞に付随する機能語。

CCONJ

調整積

調整接続詞は、文中の単語、フレーズ、または句を、一方を他方に従属させることなく接続します。

CONJ

接続詞

接続詞は、文中の単語、フレーズ、または句を結び付けます。

これ

限定詞

特定の名詞句を指定する記事やその他の単語。

INTJ

間投詞

感嘆符または感嘆符の一部として使用される単語。

名詞

名詞

人、場所、物、動物、またはアイデアを指定する単語。

名詞

NUMERIC

数字を表す単語(通常は限定詞、形容詞、代名詞)。

O

その他

品詞カテゴリに割り当てることができない単語。

PART

粒子

意味を伝えるために別の単語またはフレーズに関連付けられた機能語。

プロン

代名詞

名詞または名詞句の代わりとなる単語。

PROPN

固有名詞

特定の個人、場所、またはオブジェクトの名前である名詞。

パンク

句読点

テキストを区切る非アルファベット文字。

SCONJ

従属積

従属節を文に結合する接続詞。従属接続詞の例として「because」があります。

SYM

記号

ドル記号 ($) や数学記号などの単語に似たエンティティ。

動詞

Verb

出来事や行動を示す言葉。

品詞の詳細については、「」を参照してください。Universal タグユニバーサル依存関係ウェブサイト.

オペレーションは、単語と、その単語がテキスト内で表す品詞を識別するトークンを返します。各トークンは、ソーステキスト内の単語を表します。これは、原文中の単語の位置、その単語がテキストで取り込む品詞、品詞が正しく識別されたというAmazon Comprehend の信頼、およびソーステキストから解析された単語を提供します。

シンタックストークンのリストの構造を以下に示します。ドキュメント内の各単語の場合、構文トークンが 1 つ生成されます。

{ "SyntaxTokens": [ { "BeginOffset": number, "EndOffset": number, "PartOfSpeech": { "Score": number, "Tag": "string" }, "Text": "string", "TokenId": number } ] }

各トークンは以下の情報を提供します。

  • BeginOffsetそしてEndOffset入力テキスト内の単語の位置が表示されます。

  • PartOfSpeech—次の 2 つの情報を提供します。Tag品詞を識別しますScoreこれは、品詞が正しく識別されたという Amazon Comprehend Syntax の信頼性を表しています。

  • Text—識別された単語を提供します。

  • TokenId—トークンの識別子を提供します。識別子は、トークンのリストにおけるトークンの位置です。