Tabellen, Datenbanken und Datenkataloge in Athena verstehen - Amazon Athena

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Tabellen, Datenbanken und Datenkataloge in Athena verstehen

In Athena fungieren Kataloge, Tabellen und Datenbanken als Container für Metadatendefinitionen, die das Schema für zugrunde liegende Quelldaten definieren.

Athena verwendet die folgenden Begriffe, um sich auf Hierarchien von Datenobjekten zu beziehen:

  • Datenquelle – eine Gruppe von Datenbanken

  • Datenbank – eine Gruppe von Tabellen

  • Tabelle – Daten, die als Gruppe von Zeilen oder Spalten organisiert sind

Manchmal werden diese Objekte auch mit alternativen, aber gleichwertigen Namen bezeichnet, z. B. den folgenden:

  • Eine Datenquelle wird manchmal auch als Katalog bezeichnet.

  • Eine Datenbank wird manchmal auch als Schema bezeichnet.

Anmerkung

Diese Terminologie kann in den verbundenen Datenquellen, die Sie mit Athena verwenden, variieren. Weitere Informationen finden Sie unter Kennzeichner für föderierte Tabellennamen verstehen.

Die folgende Beispielabfrage in der Athena-Konsole verwendet die awsdatacatalog-Datenquelle, die default-Datenbank und die some_table-Tabelle.

Hierarchie der Datenobjekte im Athena-Abfragen-Editor.

Für jeden Datensatz muss in Athena eine Tabelle vorhanden sein. Aus den Metadaten in der Tabelle entnimmt Athena den Speicherort der Daten in Amazon S3 und die Struktur der Daten, z. B. Spaltennamen, Datentypen und Tabellenname. Bei Datenbanken handelt es sich um eine logische Gruppe von Tabellen; sie enthalten daher auch nur Metadaten und Schemainformationen für ein Dataset.

Für jedes Dataset, für das Sie eine Abfrage ausführen möchten, muss in Athena eine zugrunde liegende Tabelle vorhanden sein, die zum Abruf und zur Rückgabe der Abfrageergebnisse verwendet wird. Daher muss die Tabelle vor einer Datenabfrage in Athena registriert werden. Die Registrierung erfolgt bei der automatischen oder manuellen Tabellenerstellung.

Sie können mithilfe eines AWS Glue Crawlers automatisch eine Tabelle erstellen. Weitere Informationen zu AWS Glue und Crawlern finden Sie unter. Wird verwendet AWS Glue , um Athena mit Ihren Daten in Amazon S3 zu verbinden Wenn eine Tabelle AWS Glue erstellt wird, wird sie in ihrem eigenen AWS Glue Datenkatalog registriert. Athena nutzt den AWS Glue -Datenkatalog zum Speichern und Abrufen der enthaltenen Metadaten, die bei der Abfrageausführung für die Analyse des zugrunde liegenden Datensatzes verwendet werden.

Unabhängig davon, wie die Tabellen erstellt werden, wird der Datensatz im Rahmen der Tabellenerstellung in Athena registriert. Diese Registrierung erfolgt im AWS Glue Data Catalog und ermöglicht Athena, Abfragen der Daten durchzuführen. Im Athena-Abfrage-Editor wird auf diesen Katalog (oder diese Datenquelle) mit der Bezeichnung AwsDataCatalog verwiesen.

Nachdem Sie eine Tabelle erstellt haben, können Sie sie mithilfe von SQLSELECTAnweisungen abfragen, einschließlich des Abrufs bestimmter Dateispeicherorte für Ihre Quelldaten. Ihre Abfrageergebnisse werden in Amazon S3 an dem von Ihnen angegebenen Abfrageergebnisspeicherort gespeichert.

Der AWS Glue Datenkatalog ist in Ihrem gesamten Amazon Web Services Services-Konto zugänglich. Andere AWS-Services können den AWS Glue Datenkatalog gemeinsam nutzen, sodass Sie Datenbanken und Tabellen sehen können, die in Ihrer gesamten Organisation mit Athena erstellt wurden, und umgekehrt.

  • So erstellen Sie eine Tabelle manuell

    • Rufen Sie in der Athena-Konsole den Assistenten „Tabelle erstellen“ auf.

    • Verwenden Sie die Athena-Konsole, um DDL Hive-Anweisungen im Abfrage-Editor zu schreiben.

    • Verwenden Sie Athena API oderCLI, um eine SQL Abfragezeichenfolge mit DDL Anweisungen auszuführen.

    • Benutze die Athena JDBC oder den ODBC Fahrer.

Wenn Sie Tabellen und Datenbanken manuell erstellen, verwendet Athena HiveQL Data Definition Language (DDL) -Anweisungen wieCREATE TABLE,, und DROP TABLE unter der HaubeCREATE DATABASE, um Tabellen und Datenbanken in der zu erstellen. AWS Glue Data Catalog

Für den Einstieg können Sie ein Tutorial in der Athena-Konsole verwenden oder eine step-by-step Anleitung in der Athena-Dokumentation durcharbeiten.

  • Um das Tutorial in der Athena-Konsole zu verwenden, wählen Sie das Informationssymbol oben rechts in der Konsole und dann die Registerkarte Tutorial.

  • Ein step-by-step Tutorial zum Erstellen einer Tabelle und zum Schreiben von Abfragen im Athena-Abfrage-Editor finden Sie unterErste Schritte.