Amazon EMR 6.7.0 - Note sul rilascio di Hive - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Amazon EMR 6.7.0 - Note sul rilascio di Hive

Amazon EMR 6.7.0 - Modifiche a Hive

Type Descrizione
Funzionalità Integrazione di Amazon EMR Hive con. LakeFormation
Funzionalità Registrazione di verifica aggiuntiva per il committer ottimizzato per Amazon S3 di Hive EMRFS. Configurazione Hive: hive.blobstore.output-committer.logging, predefinita: false
Funzionalità Directory di destinazione eliminata durante la sovrascrittura dell'inserimento con un risultato di selezione vuoto in una tabella non partizionata/partizione statica per comportarsi in modo simile a Hive 2.x. Configurazione Hive: hive.emr.iow.clean.target.dir, predefinita: false
Bug Risolto un errore di query intermittente quando si utilizzava il committer ottimizzato per Amazon S3 di Hive EMRFS con ordinamento del bucket di partizione.
Upgrade Hive aggiornato alla versione 3.1.3. Fai riferimento a Note di rilascio di Apache Hive 3.1.3 per maggiori dettagli.
Upgrade Parquet aggiornato a 1.12.2.
Backport HIVE-20065: il metastore non dovrebbe basarsi su jackson 1.x
Backport HIVE-20071: esegui la migrazione a jackson 2.x e impedisci l'utilizzo
Backport HIVE-20607: da utilizzare per eseguire query TxnHandler SQL dirette PreparedStatement
Backport HIVE-20740: rimuove il blocco globale nel metodo.setConf ObjectStore
Backport HIVE-20961: ritiro dell'implementazione NVL
Backport HIVE-22059: il file jar hive-exec non contiene la libreria jackson (fasterxml)
Backport HIVE-22351: corregge l'utilizzo errato dei thread in ObjectStore TestObjectStore
Backport HIVE-23534: NPE in #invoke durante la cattura senza alcun messaggio RetryingMetaStoreClient MetaException
Backport HIVE-24048: armonizza i componenti Jackson alla versione 2.10.latest - Hive
Backport HIVE-24768: utilizza ovunque jackson-bom per la sostituzione della versione
Backport HIVE-24816: aggiorna jackson a 2.10.5.1 o 2.11.0+ a causa di CVE-2020-25649
Backport HIVE-25971: l'arresto dell'attività Tez viene ritardato a causa del pool di thread memorizzato nella cache non chiuso
Backport HIVE-26036: NPE causato da getMTable () in ObjectStore

Amazon EMR 6.7.0 - Problemi noti di Hive

  • Le query con funzioni finestra sulla stessa colonna di join possono portare a trasformazioni non valide, come riportato in HIVE-25278 e causare risultati errati o errori di query. Una soluzione alternativa sarebbe disabilitare CBO a livello di query per tali query. La correzione sarà disponibile in una versione di Amazon EMR successiva alla 6.7.0. Per ulteriori informazioni, contatta l'assistenza. AWS

  • Con le versioni da 6.6.0 a 6.9.x di Amazon EMR, le query INSERT con partizione dinamica e una clausola ORDER BY o SORT BY avranno sempre due riduttori. Questo problema è causato dalla modifica dell'OSS HIVE-20703, che assoggetta l'ottimizzazione dinamica delle partizioni di ordinamento a una decisione basata sui costi. Se il carico di lavoro non richiede l'ordinamento delle partizioni dinamiche, ti consigliamo di impostare la proprietà hive.optimize.sort.dynamic.partition.threshold su -1 per disabilitare la nuova caratteristica e ottenere il numero di riduttori calcolato correttamente. Questo problema è stato corretto in OSS Hive come parte di HIVE-22269 ed è stato risolto in Amazon EMR 6.10.0.