Gunakan Machine Learning (ML) dengan Amazon Athena - Amazon Athena

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Gunakan Machine Learning (ML) dengan Amazon Athena

Machine Learning (ML) dengan Amazon Athena memungkinkan Anda menggunakan Athena untuk menulis SQL pernyataan yang menjalankan inferensi Machine Learning (ML) menggunakan Amazon. SageMaker Fitur ini menyederhanakan akses ke model ML untuk analisis data, menghilangkan kebutuhan untuk menggunakan metode pemrograman yang kompleks untuk menjalankan inferensi.

Untuk menggunakan ML dengan Athena, Anda mendefinisikan sebuah ML dengan fungsi Athena dengan klausa USING EXTERNAL FUNCTION. Fungsi menunjuk ke titik akhir SageMaker model yang ingin Anda gunakan dan menentukan nama variabel dan tipe data untuk diteruskan ke model. Klausa berikutnya dalam kueri mereferensikan fungsi untuk meneruskan nilai ke model. Model ini menjalankan inferensi berdasarkan nilai-nilai yang diteruskan oleh kueri, kemudian mengembalikan hasil inferensi. Untuk informasi selengkapnya tentang SageMaker dan cara kerja SageMaker titik akhir, lihat Panduan SageMaker Pengembang Amazon.

Untuk contoh yang menggunakan ML dengan Athena dan SageMaker inferensi untuk mendeteksi nilai anomali dalam kumpulan hasil, lihat artikel Blog AWS Big Data Mendeteksi nilai anomali dengan menjalankan fungsi inferensi pembelajaran mesin Amazon Athena.

Pertimbangan dan batasan

  • Wilayah yang Tersedia - Fitur Athena MLadalah fitur di mana mesin Wilayah AWS Athena versi 2 atau yang lebih baru didukung.

  • SageMaker titik akhir model harus menerima dan mengembalikan text/csv — Untuk informasi selengkapnya tentang format data, lihat Format data umum untuk inferensi di Panduan SageMaker Pengembang Amazon.

  • Athena tidak mengirim CSV header - Jika SageMaker titik akhir Andatext/csv, penangan input Anda tidak boleh berasumsi bahwa baris pertama input adalah header. CSV Karena Athena tidak mengirim CSV header, output yang dikembalikan ke Athena akan berisi satu baris lebih sedikit dari yang diharapkan Athena dan menyebabkan kesalahan.

  • SageMaker penskalaan titik akhir — Pastikan titik akhir SageMaker model yang direferensikan cukup ditingkatkan untuk panggilan Athena ke titik akhir. Untuk informasi selengkapnya, lihat Menskalakan SageMaker model secara otomatis di Panduan SageMaker Pengembang Amazon dan CreateEndpointConfigdi SageMaker APIReferensi Amazon.

  • IAMizin — Untuk menjalankan kueri yang menentukan fungsi HTML dengan Athena, IAM prinsipal yang menjalankan kueri harus diizinkan untuk melakukan sagemaker:InvokeEndpoint tindakan untuk titik akhir model yang direferensikan. SageMaker Untuk informasi selengkapnya, lihat Izinkan akses untuk ML dengan Athena.

  • ML dengan fungsi Athena tidak dapat digunakan dalam klausa secara langsung GROUP BY