Konektor Amazon Athena Teradata - Amazon Athena

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Konektor Amazon Athena Teradata

Konektor Amazon Athena untuk Teradata memungkinkan Athena menjalankan kueri SQL pada data yang disimpan dalam database Teradata Anda.

Prasyarat

Batasan

  • Menulis operasi DDL tidak didukung.

  • Dalam pengaturan multiplexer, bucket tumpahan dan awalan dibagikan di semua instance database.

  • Batas Lambda yang relevan. Untuk informasi selengkapnya, lihat Kuota Lambda dalam Panduan Pengembang AWS Lambda .

Ketentuan

Istilah-istilah berikut berhubungan dengan konektor Teradata.

  • Instans database — Instance apa pun dari database yang digunakan di tempat, di Amazon EC2, atau di Amazon RDS.

  • Handler - Handler Lambda yang mengakses instance database Anda. Handler bisa untuk metadata atau untuk catatan data.

  • Metadata handler — Penangan Lambda yang mengambil metadata dari instance database Anda.

  • Record handler - Handler Lambda yang mengambil catatan data dari instance database Anda.

  • Composite handler — Handler Lambda yang mengambil data metadata dan data dari instance database Anda.

  • Properti atau parameter - Properti database yang digunakan oleh penangan untuk mengekstrak informasi database. Anda mengonfigurasi properti ini sebagai variabel lingkungan Lambda.

  • Connection String — Sebuah string teks yang digunakan untuk membuat koneksi ke instance database.

  • Katalog —AWS Glue Non-katalog yang terdaftar di Athena yang merupakan awalan yang diperlukan untuk properti. connection_string

  • Multiplexing handler - Handler Lambda yang dapat menerima dan menggunakan beberapa koneksi database.

Prasyarat lapisan Lambda

Untuk menggunakan konektor Teradata dengan Athena, Anda harus membuat layer Lambda yang menyertakan driver Teradata JDBC. Lapisan Lambda adalah arsip .zip file yang berisi kode tambahan untuk fungsi Lambda. Saat Anda menerapkan konektor Teradata ke akun Anda, Anda menentukan ARN layer. Ini menempelkan lapisan Lambda dengan driver Teradata JDBC ke konektor Teradata sehingga Anda dapat menggunakannya dengan Athena.

Untuk informasi selengkapnya tentang layer Lambda, lihat Membuat dan berbagi layer Lambda di Panduan Pengembang.AWS Lambda

Untuk membuat layer Lambda untuk konektor teradata
  1. Jelajahi halaman unduhan driver Teradata JDBC di https://downloads.teradata.com/download/connectivity/jdbc-driver.

  2. Unduh driver Teradata JDBC. Situs web mengharuskan Anda untuk membuat akun dan menerima perjanjian lisensi untuk mengunduh file.

  3. Ekstrak terajdbc4.jar file dari file arsip yang Anda unduh.

  4. Buat struktur folder berikut dan tempatkan .jar file di dalamnya.

    java\lib\terajdbc4.jar

  5. Buat .zip file dari seluruh struktur folder yang berisi terajdbc4.jar file.

  6. Masuk ke AWS Management Console dan buka AWS Lambda konsol di https://console.aws.amazon.com/lambda/.

  7. Di panel navigasi, pilih Layers, lalu pilih Create layer.

  8. Untuk Nama, masukkan nama untuk layer (misalnya,TeradataJava11LambdaLayer).

  9. Pastikan opsi Unggah file.zip dipilih.

  10. Pilih Unggah, lalu unggah folder zip yang berisi driver Teradata JDBC.

  11. Pilih Buat.

  12. Pada halaman detail untuk layer, salin layer ARN dengan memilih ikon clipboard di bagian atas halaman.

  13. Simpan ARN untuk referensi.

Parameter

Gunakan variabel lingkungan Lambda di bagian ini untuk mengonfigurasi konektor Teradata.

String koneksi

Gunakan string koneksi JDBC dalam format berikut untuk terhubung ke instance database.

teradata://${jdbc_connection_string}

Menggunakan handler multiplexing

Anda dapat menggunakan multiplexer untuk terhubung ke beberapa instance database dengan satu fungsi Lambda. Permintaan dirutekan dengan nama katalog. Gunakan kelas berikut di Lambda.

Handler Kelas
Handler komposit TeradataMuxCompositeHandler
Penangan metadata TeradataMuxMetadataHandler
Rekam handler TeradataMuxRecordHandler

Parameter handler multiplexing

Parameter Deskripsi
$catalog_connection_string Wajib. Sebuah string koneksi instance database. Awalan variabel lingkungan dengan nama katalog yang digunakan di Athena. Misalnya, jika katalog terdaftar di Athena adalahmyteradatacatalog, maka nama variabel lingkungan adalah. myteradatacatalog_connection_string
default Wajib. String koneksi default. String ini digunakan ketika katalog lambda:${ }AWS_LAMBDA_FUNCTION_NAME.

Contoh properti berikut adalah untuk fungsi Teradata MUX Lambda yang mendukung dua instance databaseteradata1: (default), dan. teradata2

Properti Nilai
default teradata://jdbc:teradata://teradata2.host/TMODE=ANSI,CHARSET=UTF8,DATABASE=TEST,user=sample2&password=sample2
teradata_catalog1_connection_string teradata://jdbc:teradata://teradata1.host/TMODE=ANSI,CHARSET=UTF8,DATABASE=TEST,${Test/RDS/Teradata1}
teradata_catalog2_connection_string teradata://jdbc:teradata://teradata2.host/TMODE=ANSI,CHARSET=UTF8,DATABASE=TEST,user=sample2&password=sample2

Memberikan kredensi

Untuk memberikan nama pengguna dan kata sandi untuk database Anda dalam string koneksi JDBC Anda, Anda dapat menggunakan properti string koneksi atau. AWS Secrets Manager

  • Connection String - Nama pengguna dan kata sandi dapat ditentukan sebagai properti dalam string koneksi JDBC.

    penting

    Sebagai praktik keamanan terbaik, jangan gunakan kredensyal hardcode dalam variabel lingkungan atau string koneksi Anda. Untuk informasi tentang memindahkan rahasia hardcode Anda AWS Secrets Manager, lihat Memindahkan rahasia hardcode ke AWS Secrets Manager dalam Panduan Pengguna.AWS Secrets Manager

  • AWS Secrets Manager— Untuk menggunakan fitur Query Federasi Athena dengan, VPC AWS Secrets Manager yang terhubung ke fungsi Lambda Anda harus memiliki akses internet atau titik akhir VPC untuk terhubung ke Secrets Manager.

    Anda dapat memasukkan nama rahasia ke AWS Secrets Manager dalam string koneksi JDBC Anda. Konektor menggantikan nama rahasia dengan password nilai username dan dari Secrets Manager.

    Untuk instans database Amazon RDS, dukungan ini terintegrasi erat. Jika Anda menggunakan Amazon RDS, kami sangat menyarankan penggunaan AWS Secrets Manager dan rotasi kredensyal. Jika database Anda tidak menggunakan Amazon RDS, simpan kredensialnya sebagai JSON dalam format berikut:

    {"username": "${username}", "password": "${password}"}
Contoh string koneksi dengan nama rahasia

String berikut memiliki nama rahasia${Test/RDS/Teradata1}.

teradata://jdbc:teradata1.host/TMODE=ANSI,CHARSET=UTF8,DATABASE=TEST,${Test/RDS/Teradata1}&...

Konektor menggunakan nama rahasia untuk mengambil rahasia dan memberikan nama pengguna dan kata sandi, seperti pada contoh berikut.

teradata://jdbc:teradata://teradata1.host/TMODE=ANSI,CHARSET=UTF8,DATABASE=TEST,...&user=sample2&password=sample2&...

Saat ini, Teradata mengenali properti user dan password JDBC. Ini juga menerima nama pengguna dan kata sandi dalam kata /sandi format nama pengguna tanpa kunci user ataupassword.

Menggunakan handler koneksi tunggal

Anda dapat menggunakan metadata koneksi tunggal berikut dan penangan rekaman untuk terhubung ke satu instance Teradata.

Jenis handler Kelas
Handler komposit TeradataCompositeHandler
Penangan metadata TeradataMetadataHandler
Rekam handler TeradataRecordHandler

Parameter handler koneksi tunggal

Parameter Deskripsi
default Wajib. String koneksi default.

Penangan koneksi tunggal mendukung satu instance database dan harus menyediakan parameter string default koneksi. Semua string koneksi lainnya diabaikan.

Properti contoh berikut adalah untuk instance Teradata tunggal yang didukung oleh fungsi Lambda.

Properti Nilai
default teradata://jdbc:teradata://teradata1.host/TMODE=ANSI,CHARSET=UTF8,DATABASE=TEST,secret=Test/RDS/Teradata1

Parameter tumpahan

Lambda SDK dapat menumpahkan data ke Amazon S3. Semua instance database yang diakses oleh fungsi Lambda yang sama tumpah ke lokasi yang sama.

Parameter Deskripsi
spill_bucket Wajib. Nama ember tumpahan.
spill_prefix Wajib. Tumpahkan key prefix bucket.
spill_put_request_headers (Opsional) Peta header permintaan dan nilai yang disandikan JSON untuk permintaan Amazon S3 yang digunakan untuk menumpahkan (misalnya,). putObject {"x-amz-server-side-encryption" : "AES256"} Untuk kemungkinan header lainnya, lihat PutObjectdi Referensi API Amazon Simple Storage Service.

Dukungan tipe data

Tabel berikut menunjukkan tipe data yang sesuai untuk JDBC dan Apache Arrow.

JDBC Panah
Boolean Bit
Bilangan Bulat Mungil
Pendek berkulit kecil
Bilangan Bulat Int
Long Bigint
float Mengapung4
Ganda Mengapung8
Tanggal DateDay
Stempel Waktu DateMilli
String Varchar
Byte Varbiner
BigDecimal Decimal
ARRAY Daftar

Partisi dan split

Partisi diwakili oleh kolom partisi tunggal tipeInteger. Kolom berisi nama partisi dari partisi yang didefinisikan pada tabel Teradata. Untuk tabel yang tidak memiliki nama partisi, * dikembalikan, yang setara dengan satu partisi. Partisi setara dengan split.

Nama Tipe Deskripsi
partisi Bilangan Bulat Dinamakan partisi di Teradata.

Kinerja

Teradata mendukung partisi asli. Konektor Athena Teradata dapat mengambil data dari partisi ini secara paralel. Jika Anda ingin menanyakan kumpulan data yang sangat besar dengan distribusi partisi yang seragam, partisi asli sangat disarankan. Memilih subset kolom secara signifikan memperlambat runtime kueri. Konektor menunjukkan beberapa pelambatan karena konkurensi.

Konektor Athena Teradata melakukan pushdown predikat untuk mengurangi data yang dipindai oleh kueri. Predikat sederhana dan ekspresi kompleks didorong ke konektor untuk mengurangi jumlah data yang dipindai dan mengurangi waktu eksekusi kueri.

Predikat

Predikat adalah ekspresi dalam WHERE klausa kueri SQL yang mengevaluasi nilai Boolean dan menyaring baris berdasarkan beberapa kondisi. Konektor Athena Teradata dapat menggabungkan ekspresi ini dan mendorongnya langsung ke Teradata untuk meningkatkan fungsionalitas dan untuk mengurangi jumlah data yang dipindai.

Operator konektor Athena Teradata berikut mendukung pushdown predikat:

  • Boolean: DAN, ATAU, TIDAK

  • KESETARAAN: SAMA, NOT_EQUAL, LESS_THAN, LESS_THAN_OR_EQUAL, GREATER_THAN, GREATER_THAN_OR_EQUAL, NULL_IF, IS_NULL

  • Aritmatika: TAMBAHKAN, KURANGI, KALIKAN, BAGI, MODULUS, MENIADAKAN

  • Lainnya: LIKE_PATTERN, IN

Contoh pushdown gabungan

Untuk kemampuan kueri yang ditingkatkan, gabungkan jenis pushdown, seperti pada contoh berikut:

SELECT * FROM my_table WHERE col_a > 10 AND ((col_a + col_b) > (col_c % col_d)) AND (col_e IN ('val1', 'val2', 'val3') OR col_f LIKE '%pattern%');

Kueri passthrough

Konektor Teradata mendukung kueri passthrough. Kueri passthrough menggunakan fungsi tabel untuk mendorong kueri lengkap Anda ke sumber data untuk dieksekusi.

Untuk menggunakan kueri passthrough dengan Teradata, Anda dapat menggunakan sintaks berikut:

SELECT * FROM TABLE( system.query( query => 'query string' ))

Contoh query berikut mendorong ke bawah query ke sumber data di Teradata. Kueri memilih semua kolom dalam customer tabel, membatasi hasilnya menjadi 10.

SELECT * FROM TABLE( system.query( query => 'SELECT * FROM customer LIMIT 10' ))

Informasi lisensi

Dengan menggunakan konektor ini, Anda mengakui penyertaan komponen pihak ketiga, daftar yang dapat ditemukan dalam file pom.xml untuk konektor ini, dan menyetujui persyaratan dalam masing-masing lisensi pihak ketiga yang disediakan dalam file LICENSE.txt di .com. GitHub

Sumber daya tambahan

Untuk informasi versi driver JDBC terbaru, lihat file pom.xml untuk konektor Teradata di.com. GitHub

Untuk informasi tambahan tentang konektor ini, kunjungi situs terkait GitHub di.com.