Retry duration (Durata nuovi tentativi)Richieste di dati in parallelo Durata dei processi Ora delle richieste

Argomenti aggiuntivi

Di seguito sono riportati alcuni altri modi per ottimizzare le applicazioni che utilizzano Hive per accedere a DynamoDB.

Retry duration (Durata nuovi tentativi)

Per impostazione predefinita, Hive rieseguirà un processo Hadoop se non ha restituito alcun risultato da DynamoDB entro due minuti. È possibile regolare questo intervallo modificando il parametro dynamodb.retry.duration:


SET dynamodb.retry.duration=2;

Il valore deve essere un numero intero diverso da zero, che rappresenta il numero di minuti nell'intervallo di nuovi tentativi. Il valore predefinito per dynamodb.retry.duration è 2 (minuti).

Richieste di dati in parallelo

Molteplici richieste di dati, sia da parte di più utenti sia da più applicazioni verso un'unica tabella, possono far esaurire il throughput di lettura assegnato e rallentare le prestazioni.

Durata dei processi

La consistenza dei dati in DynamoDB dipende dall'ordine delle operazioni di lettura e scrittura di ciascun nodo. Quando una query Hive è in avanzamento, un'altra applicazione potrebbe caricare nuovi dati nella tabella DynamoDB oppure modificare o eliminare dati esistenti. In questo caso, i risultati della query Hive potrebbe non riflettere le modifiche effettuate ai dati durante l'esecuzione della query.

Ora delle richieste

Le prestazioni possono essere migliorate pianificando query Hive che accedono a una tabella DynamoDB quando la richiesta nella tabella DynamoDB è minore. Ad esempio, se la maggior parte degli utenti della tua applicazione vive a San Francisco, potresti decidere di esportare i dati giornalieri alle 4:00 PST, quando la maggior parte degli utenti dorme e non aggiorna i record del database DynamoDB.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Regolazione dei mappatori

Integrazione con S3