Topik tambahan - Amazon DynamoDB

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Topik tambahan

Berikut ini adalah beberapa cara untuk menyetel aplikasi yang menggunakan Hive untuk mengakses DynamoDB.

Durasi percobaan ulang

Secara default, Hive akan menjalankan kembali tugas Hadoop jika sama sekali belum mengembalikan hasil apa pun dari DynamoDB dalam waktu dua menit. Anda dapat menyesuaikan interval ini dengan mengubah parameter dynamodb.retry.duration:

SET dynamodb.retry.duration=2;

Nilainya harus berupa angka bulat selain nol, yang mewakili jumlah menit dalam interval percobaan ulang. Default untuk dynamodb.retry.duration adalah 2 (menit).

Permintaan data paralel

Beberapa permintaan data, baik dari lebih dari satu pengguna atau lebih dari satu aplikasi ke satu tabel dapat menguras throughput baca yang disediakan dan memperlambat performa.

Durasi proses

Konsistensi data di DynamoDB bergantung pada urutan operasi baca dan tulis pada setiap simpul. Saat kueri Hive sedang berjalan, aplikasi lain mungkin memuat data baru ke dalam tabel DynamoDB atau memodifikasi atau menghapus data yang ada. Dalam kasus ini, hasil kueri Hive mungkin tidak mencerminkan perubahan yang dilakukan pada data saat kueri sedang berjalan.

Waktu permintaan

Menjadwalkan kueri Hive yang mengakses tabel DynamoDB ketika permintaan pada tabel DynamoDB rendah akan meningkatkan performa. Misalnya, jika sebagian besar pengguna aplikasi Anda tinggal di San Francisco, Anda dapat memilih untuk mengekspor data harian pada pukul 04.00 PST ketika sebagian besar pengguna tertidur dan tidak memperbarui catatan di basis data DynamoDB Anda.