Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwenden Sie Machine Learning (ML) mit Amazon Athena
Mit Machine Learning (ML) mit Amazon Athena können Sie Athena verwenden, um SQL Anweisungen zu schreiben, die Machine Learning (ML) -Inferenzen mit Amazon ausführen. SageMaker Dieses Feature vereinfacht den Zugriff auf ML-Modelle zum Zweck von Datenanalysen. Daher müssen keine komplexen Programmiermethoden verwendet werden, um Inferenzen auszuführen.
Um ML mit Athena zu verwenden, definieren Sie eine ML mit Athena Funktion mit der USING EXTERNAL
FUNCTION
-Klausel. Die Funktion zeigt auf den SageMaker Modellendpunkt, den Sie verwenden möchten, und spezifiziert die Variablennamen und Datentypen, die an das Modell übergeben werden sollen. Die folgenden Klauseln in der Abfrage verweisen auf die Funktion, um Werte an das Modell zu übergeben. Das Modell führt Inferenzen basierend auf den von der Abfrage übergebenen Werten aus und gibt anschließend Inferenzergebnisse zurück. Weitere Informationen zu SageMaker und zur Funktionsweise von SageMaker Endgeräten finden Sie im Amazon SageMaker Developer Guide.
Ein Beispiel, das ML mit Athena und SageMaker Inferenz verwendet, um einen anomalen Wert in einer Ergebnismenge zu erkennen, finden Sie im AWS Big Data-Blogartikel Erkennen anomaler Werte durch Aufrufen
Überlegungen und Einschränkungen
-
Verfügbare Regionen — Die Athena ML-Funktion ist eine Funktion, AWS-Regionen in der die Athena Engine Version 2 oder höher unterstützt wird.
-
SageMaker model endpoint must accept and return
text/csv
— Weitere Informationen zu Datenformaten finden Sie unter Common Data Formats for Inference im Amazon SageMaker Developer Guide. -
Athena sendet keine CSV Header — Wenn Ihr SageMaker Endpunkt dies ist
text/csv
, sollte Ihr Eingabe-Handler nicht davon ausgehen, dass die erste Zeile der Eingabe ein CSV Header ist. Da Athena keine CSV Header sendet, enthält die an Athena zurückgegebene Ausgabe eine Zeile weniger als von Athena erwartet, und verursacht einen Fehler. -
SageMaker Endpunktskalierung — Stellen Sie sicher, dass der SageMaker Referenzmodellendpunkt für Athena-Aufrufe an den Endpunkt ausreichend hochskaliert ist. Weitere Informationen finden Sie unter Automatisches Skalieren von SageMaker Modellen im Amazon SageMaker Developer Guide und CreateEndpointConfigin der SageMaker APIAmazon-Referenz.
-
IAMBerechtigungen — Um eine Abfrage auszuführen, die eine ML mit Athena-Funktion spezifiziert, muss der IAM Prinzipal, der die Abfrage ausführt, berechtigt sein, die
sagemaker:InvokeEndpoint
Aktion für den referenzierten SageMaker Modellendpunkt auszuführen. Weitere Informationen finden Sie unter Erlauben des Zugriffs für ML mit Athena. -
ML-Athena-Funktionen dürfen in
GROUP BY
-Klauseln nicht direkt verwendet werden