Leistungsoptimierung - Amazon-DynamoDB

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Leistungsoptimierung

Wenn Sie eine externe Hive-Tabelle erstellen, die einer DynamoDB-Tabelle zugeordnet ist, wird keine Lese- oder Schreibkapazität von DynamoDB belegt. Lese- und Schreibaktivitäten in der Hive-Tabelle (wie INSERT oder SELECT) wirken sich jedoch direkt als Lese- und Schreibvorgänge in der zugrunde liegenden DynamoDB-Tabelle aus.

Apache Hive in Amazon EMR implementiert eine eigene Logik zum Ausgleichen der I/O-Last in der DynamoDB-Tabelle und versucht, den bereitgestellten Durchsatz der Tabelle möglichst nicht zu überschreiten. Am Ende jeder Hive-Abfrage gibt Amazon EMR Laufzeitmetriken zurück, einschließlich der Anzahl von Überschreitungen des bereitgestellten Durchsatzes. Anhand dieser Informationen in Verbindung mit CloudWatch-Metriken in Ihrer DynamoDB-Tabelle können Sie die Leistung der nachfolgenden Abfragen verbessern.

Die Amazon-EMR-Konsole bietet grundlegende Überwachungstools für Ihren Cluster. Weitere Informationen finden Sie unter Anzeigen und Überwachen eines Clusters im Managementleitfaden für Amazon EMR.

Außerdem können Sie Ihren Cluster und Hadoop-Aufträge mithilfe von webbasierten Tools wie Hue und Ganglia sowie der Hadoop-Webschnittstelle überwachen. Weitere Informationen finden Sie unter Anzeigen von auf Amazon-EMR-Clustern gehosteten Webschnittstellen im Management Guide für Amazon EMR.

In diesem Abschnitt werden Schritte beschrieben, wie Sie die Leistung von Hive-Operationen für externe DynamoDB-Tabellen optimieren können.