Argomenti aggiuntivi - Amazon DynamoDB

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Argomenti aggiuntivi

Di seguito sono riportati alcuni altri modi per ottimizzare le applicazioni che utilizzano Hive per accedere a DynamoDB.

Retry duration (Durata nuovi tentativi)

Per impostazione predefinita, Hive rieseguirà un processo Hadoop se non ha restituito alcun risultato da DynamoDB entro due minuti. È possibile regolare questo intervallo modificando il parametro dynamodb.retry.duration:

SET dynamodb.retry.duration=2;

Il valore deve essere un numero intero diverso da zero, che rappresenta il numero di minuti nell'intervallo di nuovi tentativi. Il valore predefinito per dynamodb.retry.duration è 2 (minuti).

Richieste di dati in parallelo

Molteplici richieste di dati, sia da parte di più utenti sia da più applicazioni verso un'unica tabella, possono far esaurire il throughput di lettura assegnato e rallentare le prestazioni.

Durata dei processi

La consistenza dei dati in DynamoDB dipende dall'ordine delle operazioni di lettura e scrittura di ciascun nodo. Quando una query Hive è in avanzamento, un'altra applicazione potrebbe caricare nuovi dati nella tabella DynamoDB oppure modificare o eliminare dati esistenti. In questo caso, i risultati della query Hive potrebbe non riflettere le modifiche effettuate ai dati durante l'esecuzione della query.

Ora delle richieste

Le prestazioni possono essere migliorate pianificando query Hive che accedono a una tabella DynamoDB quando la richiesta nella tabella DynamoDB è minore. Ad esempio, se la maggior parte degli utenti della tua applicazione vive a San Francisco, potresti decidere di esportare i dati giornalieri alle 4:00 PST, quando la maggior parte degli utenti dorme e non aggiorna i record del database DynamoDB.