Elaborazione delle istruzioni HiveQL - Amazon DynamoDB

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Elaborazione delle istruzioni HiveQL

Hive è un'applicazione che funziona su Hadoop, un framework orientato ai batch per l'esecuzione di lavori. MapReduce Quando emetti un'istruzione HiveQL, Hive determina se può restituire immediatamente i risultati o se deve inviare un lavoro. MapReduce

Ad esempio, si consideri la tabella ddb_features(da Tutorial: Utilizzo di Amazon DynamoDB e Apache Hive). La seguente query Hive stampa le abbreviazioni di stato e il numero di summit in ciascuno di essi:

SELECT state_alpha, count(*) FROM ddb_features WHERE feature_class = 'Summit' GROUP BY state_alpha;

Hive non restituisce immediatamente i risultati. Invia invece un MapReduce lavoro, che viene elaborato dal framework Hadoop. Hive attenderà fino al completamento del processo prima di visualizzare i risultati della query:

AK 2 AL 2 AR 2 AZ 3 CA 7 CO 2 CT 2 ID 1 KS 1 ME 2 MI 1 MT 3 NC 1 NE 1 NM 1 NY 2 OR 5 PA 1 TN 1 TX 1 UT 4 VA 1 VT 2 WA 2 WY 3 Time taken: 8.753 seconds, Fetched: 25 row(s)

Monitoraggio e annullamento dei processi

Quando Hive avvia un processo Hadoop, stampa l'output da quel processo. Lo stato di completamento del processo viene aggiornato man mano che il processo va avanti. In alcuni casi, lo stato potrebbe non essere aggiornato per un lungo periodo di tempo. Ciò può verificarsi, ad esempio, quando si esegue una query su una tabella DynamoDB di grandi dimensioni con un'impostazione di capacità di lettura con provisioning basso.

Se è necessario annullare il processo prima che sia completato, è possibile digitare Ctrl+C in qualsiasi momento.