Syntaxanalyse - Amazon Comprehend

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Syntaxanalyse

Verwenden Sie die Syntaxanalyse, um die Wörter aus dem Dokument zu analysieren und den Sprachteil oder die syntaktische Funktion für jedes Wort im Dokument zurückzugeben. Sie können die Substantive, Verben, Adjektive usw. in Ihrem Dokument identifizieren. Verwenden Sie diese Informationen, um den Inhalt Ihrer Dokumente besser zu verstehen und die Beziehung der Wörter im Dokument zu verstehen.

Sie können beispielsweise in einem Dokument nach den Substances und dann nach den Verben suchen, die sich auf diese Substances beziehen. In einem Satz wie „Meine Großmundin hat ihre Couch verschoben“ sehen Sie die Substantive, „Urgroßmother“ und „Couch“ und das Verb „Verschiebt“. Sie können diese Informationen verwenden, um Anwendungen für die Textanalyse für Wortkombinationen zu erstellen, die Sie interessieren.

Um die Analyse zu starten, analysiert Amazon Comprehend den Quelltext, um die einzelnen Wörter im Text zu finden. Nachdem der Text analysiert wurde, wird jedem Wort der Sprachteil zugewiesen, den es im Quelltext aufnimmt.

Amazon Comprehend kann die folgenden Sprachteile identifizieren.

Token Sprachteil
ADJ

Adjektiv

Wörter, die normalerweise Substantive ändern.

ADP

Adposition

Der Kopf einer präpositionalen oder postpositionalen Phrase.

Bol

Adverb

Wörter, die Verben normalerweise ändern. Sie können auch Adjective und andere Adverbs ändern.

EinUX

Hilfsprogramm

Funktionswörter, die das Verb einer Verb-Phrase unterstützen.

KCONJ

Koordinierungsverbindung

Eine koordinierende Verbindung verbindet Wörter, Wortgruppen oder Klauseln in einem Satz, ohne eine untereinander zu ordnen.

CONJ

Konjunktion

Eine Verbindung verbindet Wörter, Wortgruppen oder Klauseln in einem Satz.

DET

-Ermittler

Artikel und andere Wörter, die eine bestimmte Wortgruppe angeben.

INTJ

Interjizieren

Wörter, die als Ausrufezeichen oder Teil eines Ausrufezeichens verwendet werden.

NUN

Substantiv

Wörter, die eine Person, einen Ort, ein Objekt, einen Arzt oder eine Idee angeben.

NUM

Numerisch

Wörter, in der Regel Bestimmte, Adjektive oder Pronomen, die eine Zahl ausdrücken.

O

Sonstige

Wörter, denen kein Teil der Sprachkategorie zugewiesen werden kann.

PART

Partikel

Funktionswörter, die mit einem anderen Wort oder einer anderen Phrase verknüpft sind, um die Bedeutung zu unteilen.

PRON

Pronom

Wörter, die Substantive oder Substantive ersetzen.

PROPN

Ordnungsgemäßes Substantiv

Ein Substantiv, das der Name einer bestimmten Person, eines bestimmten Orts oder eines bestimmten Objekts ist.

PUNCT

Interpunktion

Nicht alphabetische Zeichen, die Text trennen.

SCONJ

Subordinierungsverbindung

Eine Verbindung, die eine abhängige Klausel mit einem Satz verbindet. Ein Beispiel für eine untergeordnete Verbindung ist „verursachen“.

SYM

Symbol

Wörterähnliche Entitäten wie das Dollarzeichen ($) oder mathematische Symbole.

VERB

Verb

Wörter, die Ereignisse und Aktionen signalisieren.

Weitere Informationen zu den Sprachteilen finden Sie unter Universal POS Tags auf der Website Universal Dependencies.

Die Operationen geben Token zurück, die das Wort und den Sprachteil identifizieren, den das Wort im Text darstellt. Jedes Token steht für ein Wort im Quelltext. Es gibt die Position des Wortes in der Quelle, den Sprachteil, den das Wort im Text aufnimmt, das Vertrauen, dass Amazon Comprehend hat, dass der Sprachteil korrekt identifiziert wurde, und das Wort, das aus dem Quelltext analysiert wurde.

Im Folgenden finden Sie die Struktur der Liste der Syntax-Token. Für jedes Wort im Dokument wird ein Syntax-Token generiert.

{ "SyntaxTokens": [ { "BeginOffset": number, "EndOffset": number, "PartOfSpeech": { "Score": number, "Tag": "string" }, "Text": "string", "TokenId": number } ] }

Jedes Token enthält die folgenden Informationen:

  • BeginOffset und EndOffset– Gibt die Position des Wortes im Eingabetext an.

  • PartOfSpeech– Stellt zwei Informationen bereit, die den Sprachteil identifiziertTag, und die Score, die das Vertrauen darstellt, dass die Amazon Comprehend Syntax den Sprachteil korrekt identifiziert hat.

  • Text– Gibt das identifizierte Wort an.

  • TokenId– Stellt eine Kennung für das Token bereit. Die Kennung ist die Position des Tokens in der Liste der Token.