Überlegungen und Einschränkungen - Amazon Athena

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überlegungen und Einschränkungen

Wenn Sie Athena zum Lesen von Apache Hudi-Tabellen verwenden, sollten Sie die folgenden Punkte berücksichtigen.

  • Inkrementelle Abfragen — Athena unterstützt keine inkrementellen Abfragen.

  • CTAS— Athena unterstützt CTASoder INSERT INTO verwendet keine Hudi-Daten. Wenn Sie Athena-Unterstützung beim Schreiben von Hudi-Datensätzen wünschen, senden Sie Feedback an .

    Weitere Informationen zum Schreiben von Hudi-Daten finden Sie in den folgenden Ressourcen:

  • MSCKREPAIRTABLE— Die Verwendung MSCK REPAIR TABLE auf Hudi-Tabellen in Athena wird nicht unterstützt. Wenn Sie eine Hudi-Tabelle laden müssen, in AWS Glue der nicht erstellt wurde, verwenden Sie. ALTER TABLE ADD PARTITION

  • Überspringen von S3-Glacier-Objekten wird nicht unterstützt – Wenn sich Objekte in der Apache–Hudi-Tabelle in einer Amazon-S3-Glacier-Speicherklasse befinden, hat das Setzen der Tabelleneigenschaft read_restored_glacier_objects auf false keine Auswirkung.

    Angenommen, Sie führen den folgenden Befehl aus:

    ALTER TABLE table_name SET TBLPROPERTIES ('read_restored_glacier_objects' = 'false')

    Bei Iceberg- und Delta-Lake-Tabellen erzeugt der Befehl den Fehler Unsupported table property key: read_restored_glacier_objects. Bei Hudi-Tabellen erzeugt der ALTER TABLE-Befehl keinen Fehler, aber Amazon-S3-Glacier-Objekte werden immer noch nicht übersprungen. Beim Ausführen von SELECT-Abfragen nach dem ALTER TABLE-Befehl werden weiterhin alle Objekte zurückgegeben.

  • Zeitstempelabfragen — Derzeit schlagen Abfragen, die versuchen, Zeitstempelspalten in Hudi-Echtzeittabellen zu lesen, entweder fehl oder führen zu leeren Ergebnissen. Diese Einschränkung gilt nur für Abfragen, die eine Zeitstempelspalte lesen. Abfragen, die nur Spalten ohne Zeitstempel aus derselben Tabelle enthalten, sind erfolgreich.

    Fehlgeschlagene Abfragen geben eine Meldung ähnlich der folgenden zurück:

    GENERIC_ INTERNAL _ERROR: Klasse org.apache.hadoop.io. ArrayWritablekann nicht in die Klasse org.apache.hadoop.hive.serde2.io umgewandelt werden. TimestampWritableV2 (org.apache.hadoop.io). ArrayWritable und org.apache.hadoop.hive.serde2.io. TimestampWritableV2 befinden sich im unbenannten Modul des Loaders io.trino.server. PluginClassLoader @75c67992)