Syntaxanalyse

Verwenden Sie die Syntaxanalyse, um die Wörter aus dem Dokument zu analysieren und den Wortteil oder die syntaktische Funktion für jedes Wort im Dokument zurückzugeben. Sie können die Substantive, Verben, Adjektive usw. in Ihrem Dokument identifizieren. Verwenden Sie diese Informationen, um den Inhalt Ihrer Dokumente besser zu verstehen und die Beziehung der Wörter im Dokument zu verstehen.

Sie können beispielsweise in einem Dokument nach den Substantiven suchen und dann nach den Verben suchen, die sich auf diese Substantive beziehen. In einem Satz wie „Meine Großmutter hat ihre Couch umgezogen“ können Sie die Substantive „Großmutter“ und „Couch“ sowie das Verb „umgezogen“ sehen. Sie können diese Informationen verwenden, um Anwendungen zur Analyse von Text auf Wortkombinationen zu erstellen, an denen Sie interessiert sind.

Um die Analyse zu starten, analysiert Amazon Comprehend den Quelltext, um die einzelnen Wörter im Text zu finden. Nachdem der Text analysiert wurde, wird jedem Wort der Wortteil zugewiesen, den es im Quelltext verwendet.

Amazon Comprehend kann die folgenden Wortarten identifizieren.

Token	Teil der Rede
ADJ	Adjektiv Wörter, die normalerweise Substantive modifizieren.
ADP	Ablagerung Der Kopf einer Präpositional- oder Postpositionalphrase.
ADV	Adverb Wörter, die normalerweise Verben modifizieren. Sie können auch Adjektive und andere Adverbien modifizieren.
AUX	Hilfsmittel Funktionswörter, die das Verb einer Verbphrase begleiten.
CCONJ	Koordinierende Konjunktion Eine koordinierende Konjunktion verbindet Wörter, Ausdrücke oder Klauseln in einem Satz, ohne sie einander unterzuordnen.
CONJ	Konjunktion Eine Konjunktion verbindet Wörter, Phrasen oder Klauseln in einem Satz.
DET	Determinator Artikel und andere Wörter, die eine bestimmte Nominalphrase spezifizieren.
INTJ	Zwischenruf Wörter, die als Ausruf oder Teil eines Ausrufs verwendet werden.
SUBSTANTIV	Substantiv Wörter, die eine Person, einen Ort, eine Sache, ein Tier oder eine Idee beschreiben.
ZAHL	Ziffer Wörter, in der Regel Determinanten, Adjektive oder Pronomen, die eine Zahl ausdrücken.
O	Sonstige Wörter, denen kein Teil der Sprachkategorie zugewiesen werden kann.
PART	Partikel Funktionswörter, die mit einem anderen Wort oder einer Phrase verknüpft sind, um eine Bedeutung zu vermitteln.
PRON	Pronomen Wörter, die Substantive oder Nominalphrasen ersetzen.
PROPAN	Eigenname Ein Substantiv, das der Name einer bestimmten Person, eines bestimmten Ortes oder Objekts ist.
PUNKT	Interpunktion Nicht alphabetische Zeichen, die Text abgrenzen.
SCONJ	Untergeordnete Konjunktion Eine Konjunktion, die eine abhängige Klausel mit einem Satz verbindet. Ein Beispiel für eine untergeordnete Konjunktion ist „weil“.
SYM	Symbol Wortähnliche Entitäten wie das Dollarzeichen ($) oder mathematische Symbole.
VERB	Verb Worte, die Ereignisse und Handlungen signalisieren.

Weitere Informationen zu den verschiedenen Wortarten finden Sie unter Universal POS-Tags auf der Universal Dependencies-Website.

Die Operationen geben Tokens zurück, die das Wort und den Wortteil identifizieren, für den das Wort im Text steht. Jedes Token steht für ein Wort im Quelltext. Es gibt die Position des Wortes in der Quelle, den Wortteil, den das Wort im Text annimmt, die Gewissheit von Amazon Comprehend, dass der Wortteil korrekt identifiziert wurde, und das Wort, das aus dem Quelltext analysiert wurde, an.

Im Folgenden finden Sie die Struktur der Liste der Syntax-Tokens. Für jedes Wort im Dokument wird ein Syntaxtoken generiert.


{
   "SyntaxTokens": [ 
      { 
         "BeginOffset": number,
         "EndOffset": number,
         "PartOfSpeech": { 
            "Score": number,
            "Tag": "string"
         },
         "Text": "string",
         "TokenId": number
      }
   ]
}

Jedes Token enthält die folgenden Informationen:

BeginOffsetund EndOffset — Gibt die Position des Wortes im Eingabetext an.
PartOfSpeech— Stellt zwei Informationen bereit: die, Tag die den Wortteil identifiziert, und dieScore, die die Sicherheit von Amazon Comprehend Syntax darstellt, dass der Wortteil korrekt identifiziert wurde.
Text— Liefert das Wort, das identifiziert wurde.
TokenId— Stellt einen Bezeichner für das Token bereit. Der Bezeichner gibt die Position des Tokens in der Tokenliste an.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Gezielte Stimmung

Amazon Comprehend Benutzerdefiniert