Verwenden Sie die Athena-Konsole, um eine Verbindung zu einer Datenquelle herzustellen - Amazon Athena

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden Sie die Athena-Konsole, um eine Verbindung zu einer Datenquelle herzustellen

Um einen Datenquellen-Connector auszuwählen, zu benennen und bereitzustellen, verwenden Sie die Athena- und Lambda-Konsolen in einem integrierten Prozess.

So stellen Sie einen Datenquellen-Connector bereit
  1. Öffnen Sie die Athena-Konsole unter https://console.aws.amazon.com/athena/.

  2. Wenn der Navigationsbereich in der Konsole nicht sichtbar ist, wählen Sie das Erweiterungsmenü auf der linken Seite.

    Wählen Sie das Erweiterungsmenü aus.
  3. Klicken Sie im Navigationsbereich auf Data sources (Datenquellen).

  4. Wählen Sie auf der Seite Datenquellen die Option Datenquellen erstellen aus.

  5. Wählen Sie für Auswahl einer Datenquelle unter Berücksichtigung der folgenden Richtlinien die Datenquelle aus, die Athena abfragen soll:

    • Wählen Sie eine Verbundabfrageoption aus, die Ihrer Datenquelle entspricht. Athena verfügt über vorgefertigte Datenquellen-Konnektoren, die Sie für Quellen wie MySQL, Amazon DocumentDB und Postgre konfigurieren können. SQL

    • Wählen Sie S3 – AWS Glue Data Catalog, wenn Sie Daten in Amazon S3 abfragen möchten und keinen Apache-Hive-Metastore oder eine der anderen Verbundabfrage-Datenquellenoptionen auf dieser Seite verwenden. Athena benutzt den AWS Glue Data Catalog , um Metadaten und Schemainformationen für Datenquellen in Amazon S3 zu speichern. Dies ist die Standardoption (nicht verbunden). Weitere Informationen finden Sie unter Wird verwendet AWS Glue , um Athena mit Ihren Daten in Amazon S3 zu verbinden.

    • Wählen Sie S3 – Apache-Hive-Metastore, um Datensätze in Amazon S3 abzufragen, die einen Apache-Hive-Metastore verwenden. Weitere Informationen zu dieser Option finden Sie unter Athena mit einem Apache Hive-Metastore Connect.

    • Wählen Sie Benutzerdefinierter oder freigegebener Connector, wenn Sie Ihren eigenen Datenquellen-Connector für die Verwendung mit Athena erstellen möchten. Hinweise zum Schreiben eines Datenquellen-Connectors finden Sie unter Entwickeln Sie einen Datenquellen-Konnektor mit der Athena Query Federation SDK.

    In diesem Tutorial wird Amazon CloudWatch Logs als Verbunddatenquelle ausgewählt.

  6. Wählen Sie Weiter.

  7. Geben Sie auf der Seite Datenquellendetails eingeben unter Datenquellenname den Namen ein, den Sie in Ihren SQL Anweisungen verwenden möchten, wenn Sie die Datenquelle von Athena abfragen (z. B.CloudWatchLogs). Der Name kann bis zu 127 Zeichen lang sein und muss innerhalb Ihres Kontos eindeutig sein. Er kann nicht mehr geändert werden, nachdem Sie ihn erstellt haben. Gültige Zeichen sind a-z, A-Z, 0-9, _ (Unterstrich), @ (At-Zeichen) und - (Bindestrich). Die Namen awsdatacatalog, hive, jmx und system sind von Athena reserviert und können nicht für Datenquellennamen verwendet werden.

  8. Für Lambda-Funktion, wählen Sie Erstellen einer Lambda-Funktion aus. Die Funktionsseite für den ausgewählten Connector wird in der AWS Lambda Konsole geöffnet. Die Seite enthält detaillierte Informationen zum Connector.

  9. Lesen Sie unter Anwendungseinstellungen die Beschreibung für jede Anwendungseinstellung sorgfältig durch und geben Sie dann Werte ein, die Ihren Anforderungen entsprechen.

    Die angezeigten Anwendungseinstellungen variieren je nach Connector für die Datenquelle. Folgende Mindesteinstellungen sind erforderlich:

    • AthenaCatalogName— Ein Name in Kleinbuchstaben für die Lambda-Funktion, der die Datenquelle angibt, auf die sie abzielt, z. B. cloudwatchlogs

    • SpillBucket— Ein Amazon S3 S3-Bucket in Ihrem Konto zum Speichern von Daten, die die Größenbeschränkungen der Lambda-Funktion für die Antwortgröße überschreiten.

      Anmerkung

      Daten aus Datenlecks werden in nachfolgenden Ausführungen nicht wiederverwendet und können nach 12 Stunden sicher gelöscht werden. Athena löscht diese Daten nicht für Sie. Um diese Objekte zu verwalten, sollten Sie eine Richtlinie zum Objektlebenszyklus hinzufügen, die alte Daten aus Ihrem Amazon-S3-Spill-Bucket löscht. Weitere Informationen finden Sie unter Managing your storage lifecycle (Verwaltung des Speicherlebenszyklus) im Amazon-S3-Benutzerhandbuch.

  10. Wählen Sie Ich bestätige, dass diese App benutzerdefinierte IAM Rollen und Ressourcenrichtlinien erstellt. Um weitere Informationen zu erhalten, wählen Sie den Link Info .

  11. Wählen Sie Bereitstellen. Wenn die Bereitstellung abgeschlossen ist, erscheint die Lambda-Funktion im Abschnitt Ressourcen in der Lambda-Konsole.

Eine Verbindung mit der Datenquelle herstellen

Nachdem Sie den Datenquellen-Connector für Ihr Konto bereitgestellt haben, können Sie Athena mit ihm verbinden.

So verbinden Sie Athena mithilfe eines Connectors, den Sie in Ihrem Konto bereitgestellt haben, mit einer Datenquelle
  1. Kehren Sie zur Seite Datenquellendetails eingeben der Athena-Konsole zurück.

  2. Im Abschnitt Verbindungsdetails wählen Sie das Aktualisierungssymbol neben dem Suchfeld Suchen oder eine Lambda-Funktion eingeben.

  3. Wählen Sie den Namen der Funktion aus, die Sie gerade in der Lambda-Konsole erstellt haben. Die ARN Lambda-Funktion wird angezeigt.

  4. (Optional) Fügen Sie für Tags Schlüssel-Wert-Paare hinzu, die mit dieser Datenquelle verknüpft werden sollen. Weitere Informationen zu Tags erhalten Sie unter Schlagwort: Athena-Ressourcen.

  5. Wählen Sie Weiter.

  6. Auf der Seite Überprüfen und erstellen prüfen Sie die Datenquellendetails und wählen Sie dann Datenquelle erstellen aus.

  7. Der Abschnitt Datenquellendetails auf der Seite für Ihre Datenquelle zeigt Informationen über Ihren neuen Connector an. Sie können den Connector jetzt in Ihren Athena-Abfragen verwenden.

    Informationen zur Verwendung von Datenkonnektoren in Abfragen finden Sie unter Verwenden Sie föderierte Abfragen.