Amazon EMR 6.10.0: note di rilascio per Hive - Amazon EMR

Amazon EMR 6.10.0: note di rilascio per Hive

Amazon EMR 6.10.0: modifiche di Hive

Type (Tipo) Descrizione
Caratteristica Abilitazione dei controlli di accesso basati su AWS Lake Formation per le query Apache Hive (scrittura) tramite IAM Passthrough (API HiveCLI/Steps).
Miglioramenti Disabilitazione della configurazione hive.log.explain.output per impostazione predefinita per ridurre le dimensioni del log
Backport HIVE-26408: vettorizzazione: correzione della deallocazione delle colonne scratch, nessun riutilizzo di una ConstantVectorExpression secondaria come output
Backport HIVE-22269: correzione del conteggio errato dei riduttori nelle query di inserimento con partizione dinamica a causa della mancanza di statistiche provocata da HIVE-20703.
Backport HIVE-22891: omissione del passaggio di estrazione PartitionDesc in CombineHiveRecord per la modalità di esecuzione non LLAP
Backport HIVE-23804: aggiunta del database predefinito per le tabelle specifiche delle statistiche delle colonne nello schema del metastore Hive per renderle compatibili con le versioni precedenti
Backport HIVE-25277: cancellazione lenta delle partizioni Hive per gli archivi di oggetti cloud con ListFiles costosi
Backport HIVE-19202: CBO con esito negativo a causa di NullPointerException in HiveAggregate.isBucketedInput()
Backport HIVE-19048: gli errori di correzione di Initscript beeline vengono ignorati
Backport HIVE-21085: il registro delle viste materializzate avvia una sessione di tez non esterna
Backport HIVE-21675: CREATE VIEW IF NOT EXISTS restituisce un errore anziché "OK" se la vista esiste già. Questa è una regressione rispetto a Hive 2.
Backport HIVE-21646: Tez: impossibilità di TezTasks di evitare il contesto di registrazione dei thread
Backport HIVE-22054: possibilità di evitare l'elenco ricorsivo per verificare se una directory è vuota
Backport HIVE-16587: NPE quando si inseriscono tipi complessi con valori nulli annidati
Backport HIVE-22647: abilitazione del pool di sessioni per impostazione predefinita
Backport HIVE-13288: messaggio di eccezione ambiguo in DagUtils.localizeResource
Backport HIVE-23870: ottimizza più conversioni di testo in WritableHiveCharObjectInspector.getPrimitiveJavaObject / HiveCharWritable
Backport HIVE-21498: aggiornamento di Thrift a 0.13.0
Backport HIVE-24378: gli spazi iniziali e finali non vengono rimossi prima della conversione decimale
Backport HIVE-21341: valori predefiniti: hive.server2.idle.operation.timeout e hive.server2.idle.session.timeout sono troppo alti
Backport HIVE-22465: aggiunta di ssl conf in TezConfigurationFactory
Backport HIVE-24710: ottimizzazione dell'iterazione PTF per count(*) per ridurre i costi di CPU e I/O
Backport HIVE-15406: considerazione della possibilità di vettorializzare la nuova funzione "trunc"
Backport HIVE-21541: correzione delle intestazioni asf mancanti da HIVE-15406
Backport HIVE-24808: salvataggio nella cache delle date analizzate
Backport HIVE-24746: PTF: TimestampValueBoundaryScanner può essere ottimizzato durante il calcolo dell'intervallo
Backport HIVE-25059: l'evento alter viene convertito per essere rinominato durante la replica
Backport HIVE-25142: rehashing in map join nella tabella di hash rapido che causa il danneggiamento di chiavi di grandi dimensioni
Backport HIVE-23756: aggiunti altri vincoli al file package.jdo
Backport HIVE-25150: i caratteri di tabulazione non vengono rimossi prima della conversione decimale, analogamente al carattere di spazio che è stato corretto come parte di HIVE-24378
Backport HIVE-25093: date_format() UDF restituisce l'output solo nel fuso orario UTC
Backport HIVE-25268: date_format udf restituisce risultati errati per le date precedenti al 1900 se il fuso orario locale è diverso da UTC
Backport HIVE-25338: AIOBE in conv UDF se l'input è vuoto
Backport HIVE-22400: il minuto UDF con il tempo restituisce NULL
Backport HIVE-25058: PTF: TimestampValueBoundaryScanner può essere ottimizzato durante il calcolo dell'intervallo pt2 - isDistanceGreater
Backport HIVE-25449: datediff() fornisce un output errato quando viene eseguito in un'attività tez con un fuso orario diverso da UTC
Backport HIVE-23688: vettorizzazione: IndexArrayOutOfBoundsException per una colonna di tipo mappa che include un valore nullo
Backport HIVE-22247: HiveHFileOutputFormat genera FileNotFoundException quando l'output dell'attività della partizione è vuoto
Backport HIVE-25570: Hive deve inviare il percorso URL completo per l'autorizzazione per la posizione del comando insert overwrite
Backport HIVE-22903: row_number() vettorizzato reimposta il numero di riga dopo un batch in caso di espressione costante nella clausola di partizione
Backport HIVE-25549: risultati errati per la funzione finestra con espressione nella clausola PARTITION BY o ORDER BY
Backport HIVE-25579: la sovrascrittura LOAD aggiunge anziché sovrascrivere
Backport HIVE-25659: le query sql dirette di Metastore con IN/(NOT IN) devono essere suddivise in base ai parametri massimi consentiti da SQL DB
Backport HIVE-20502: correzione di NPE durante l'esecuzione di skewjoin_mapjoin10.q quando vengono utilizzate le statistiche delle colonne.
Backport HIVE-25765: la proprietà skip.header.line.count salta le righe di ogni blocco in FetchOperator quando le dimensioni del file sono maggiori
Bug Correzione di NPE all'inserimento in determinati scenari quando hive.stats.column.autogather e hive.groupby.skewindata sono entrambi abilitati
Bug Correzione di NPE quando il valore mapred.tasktracker.expiry.interval non è impostato