Connect ke sumber data - Amazon Athena

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Connect ke sumber data

Anda dapat menggunakan Amazon Athena untuk kueri data yang disimpan di lokasi dan format yang berbeda dalam set data. Dataset ini mungkin dalamCSV,JSON, Avro, Parket, atau format lainnya.

Tabel dan basis data yang Anda gunakan untuk bekerja di Athena untuk menjalankan kueri didasarkan pada metadata. Metadata adalah data tentang data yang mendasari dalam set data Anda. Bagaimana metadata tersebut menggambarkan set data Anda disebut skema. Sebagai contoh, nama tabel, nama kolom dalam tabel, dan tipe data dari setiap kolom adalah skema, disimpan sebagai metadata, yang menggambarkan set data yang mendasari. Di Athena, kita memanggil sistem untuk mengatur metadata katalog data atau metastore. Kombinasi dari set data dan katalog data yang menggambarkannya disebut sumber data.

Hubungan metadata ke set data yang mendasari tergantung tipe sumber data yang Anda gunakan. Sumber data relasional seperti MySQL, PostgreSQL, dan SQL Server mengintegrasikan metadata dengan kumpulan data dengan erat. Dalam sistem ini, metadata paling sering ditulis saat data ditulis. Sumber data lain, seperti yang dibuat menggunakan Hive, memungkinkan Anda menentukan metadata on-the-fly saat membaca kumpulan data. Dataset dapat dalam berbagai format—misalnya,, Parket CSVJSON, atau Avro.

Athena secara asli mendukung. AWS Glue Data Catalog AWS Glue Data Catalog Ini adalah katalog data yang dibangun di atas kumpulan data dan sumber data lain seperti Amazon S3, Amazon Redshift, dan Amazon DynamoDB. Anda juga dapat menghubungkan Athena ke sumber data lain dengan menggunakan berbagai konektor.