Verwenden Sie Apache Spark in Amazon Athena

Amazon Athena vereinfacht die interaktive Ausführung von Datenanalysen und -erkundungen mithilfe von Apache Spark, ohne dass Sie Ressourcen planen, konfigurieren oder verwalten müssen. Das Ausführen von Apache-Spark-Anwendungen auf Athena bedeutet, dass Spark-Code zur Verarbeitung übermittelt und die Ergebnisse direkt empfangen werden, ohne dass eine zusätzliche Konfiguration erforderlich ist. Sie können die vereinfachte Notebook-Oberfläche in der Amazon Athena Athena-Konsole verwenden, um Apache Spark-Anwendungen mit Python oder Athena Notebook zu entwickeln. APIs Apache Spark auf Amazon Athena ist Serverless und bietet eine automatische, bedarfsgerechte Skalierung, die sofortige Rechenleistung für wechselnde Daten-Volumes und Verarbeitungsanforderungen bereitstellt.

Amazon Athena bietet die folgenden Features:

Verwendung der Konsole – Übermitteln Sie Ihre Spark-Anwendungen über die Amazon-Athena-Konsole.
Scripting – Erstellen und debuggen Sie schnell und interaktiv Apache-Spark-Anwendungen in Python.
Dynamische Skalierung – Amazon Athena bestimmt automatisch die Rechen- und Arbeitsspeicherressourcen, die zum Ausführen eines Auftrags erforderlich sind, und skaliert diese Ressourcen fortlaufend entsprechend bis zu den von Ihnen angegebenen Höchstwerten. Diese dynamische Skalierung reduziert die Kosten, ohne die Geschwindigkeit zu beeinträchtigen.
Notebook-Erlebnis – Verwenden Sie den Athena-Notebook-Editor, um Berechnungen über eine vertraute Benutzeroberfläche zu erstellen, zu bearbeiten und auszuführen. Athena-Notebooks sind mit Jupyter Notebooks kompatibel und enthalten eine Liste von Zellen, die der Reihe nach als Berechnungen ausgeführt werden. Zelleninhalte können Code, Text, Markdown, Mathematik, Diagramme und Multimedia enthalten.

Weitere Informationen finden Sie unter Ausführen von Spark SQL auf Amazon Athena Spark und Erkunden Sie Ihren Data Lake mit Amazon Athena for Apache Spark im AWS Big Data-Blog.

Themen

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Auflisten benannter Abfragen

Überlegungen und Einschränkungen