语法分析 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语法分析

使用语法分析来解析文档中的单词,并返回文档中每个单词的词性或语法函数。您可以在文档中识别名词、动词、形容词等。使用此信息可以更深入地了解文档的内容,并了解文档中各个词的关系。

例如,您可以在文档中查找名词,然后查找与这些名词相关的动词。在像 “我祖母搬了沙发” 这样的句子中,你可以看到名词 “祖母” 和 “沙发” 以及动词 “移动”。您可以使用此信息构建应用程序,用于分析您感兴趣的单词组合的文本。

要开始分析,Amazon Comprehend 会解析源文本以查找文本中的单个单词。解析文本后,将为每个单词分配其在源文本中的语音部分。

Amazon Comprehend 可以识别以下语音部分。

令牌 部分演讲
调整

形容词

通常修饰名词的单词。

ADP

Adposition

介词或后置短语的开头。

ADV

副词

通常会修改动词的单词。他们还可以修改形容词和其他副词。

辅助

辅助

伴随动词短语动词的功能词。

CCONJ

协调和

协调连词将句子中的单词、短语或子句连接起来,而不使它们从属于另一个。

CONJ

连词连接句子中的单词、短语或子句。

DET

确定器

指定特定名词短语的文章和其他单词。

INTJ

感叹词

用作感叹号或感叹号一部分的单词。

名词

名词

指定人、地点、事物、动物或想法的词语。

NUM

numeric

表示数字的单词,通常是决定词、形容词或代词。

O

其他

无法分配语音类别一部分的单词。

PART

Particle

与另一个单词或短语关联的功能词,以赋予意义。

PRON

代词

代替名词或名词短语的单词。

PROPN

专有名词

一个名词,是特定个体、地点或物体的名称。

PUNCT

标点

分隔文本的非字母字符。

SCONJ

从属和

将从属子句与句子连接起来的连词。从属连词的一个例子是 “因为”。

SYM

符号

类似单词的实体,例如美元符号 ($) 或数学符号。

动词

谓词

表示事件和动作的词语。

有关词性,请参阅通用 POS 标签通用依赖项网站.

这些操作返回标识单词和该单词在文本中表示的语音部分的标记。每个标记代表源文本中的一个单词。它提供了词在源中的位置、单词在文本中所占的语音部分、Amazon Comprehend 对正确识别语音部分的信心,以及从源文本中解析出来的单词。

以下是语法标记列表的结构。为文档中的每个单词生成一个语法标记。

{ "SyntaxTokens": [ { "BeginOffset": number, "EndOffset": number, "PartOfSpeech": { "Score": number, "Tag": "string" }, "Text": "string", "TokenId": number } ] }

每个令牌提供以下信息:

  • BeginOffsetEndOffset— 提供单词在输入文本中的位置。

  • PartOfSpeech— 提供两条信息,Tag可识别词性,以及Score这代表了 Amazon Comprehend Syntax 对语音部分被正确识别的信心。

  • Text— 提供已识别的单词。

  • TokenId— 提供令牌的标识符。标识符是令牌在令牌列表中的位置。