Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Hudi
Apache Hudi
Hudi está integrado con Apache Spark
Con la versión 5.28.0 y posteriores de Amazon EMR, EMR instala los componentes de Hudi de forma predeterminada cuando se instalan Spark, Hive, Presto o Flink. Puedes usar Spark o la DeltaStreamer utilidad Hudi para crear o actualizar conjuntos de datos Hudi. Puede utilizar Hive, Spark, Presto o Flink para consultar un conjunto de datos de Hudi de forma interactiva o crear canalizaciones de procesamiento de datos mediante la extracción incremental. La extracción incremental se refiere a la capacidad de extraer únicamente los datos que han cambiado entre dos acciones.
Estas características hacen que Hudi sea adecuado para los siguientes casos de uso:
-
Trabajo con datos de transmisión desde sensores y otros dispositivos del Internet de las cosas (IoT) que requieren eventos específicos de inserción y actualización de datos.
-
Cumplimiento de la normativa de privacidad de datos en aplicaciones cuyos usuarios pueden ejercer su derecho al olvido o modificar su consentimiento para el uso de sus datos.
-
Implementación de un sistema de captura de datos de cambio (CDC)
que permita aplicar cambios a un dataset a lo largo del tiempo.
En la siguiente tabla, se muestra la versión de Hudi incluida en la última versión de la serie 7.x de Amazon EMR, junto con los componentes que Amazon EMR instala con Hudi.
Etiqueta de versión de Amazon EMR | Versión de Hudi | Componentes instalados con Hudi |
---|---|---|
emr-7.7.0 |
Hudi 0.15.0-amzn-4 |
Not available. |
En la tabla siguiente, se muestra la versión de Hudi incluida en la última versión de la serie Amazon EMR 6.x, junto con los componentes que Amazon EMR instala con Hudi.
Para ver la versión de los componentes instalados con Hudi en esta versión, consulte Versiones de los componentes de la versión 6.15.0.
Etiqueta de versión de Amazon EMR | Versión de Hudi | Componentes instalados con Hudi |
---|---|---|
emr-6.15.0 |
Hudi 0.14.0-amzn-0 |
Not available. |
nota
Amazon EMR 6.8.0 viene con Apache Hudihudi-spark3.3-bundle_2.12
de Hudi 0.12.0.
En la tabla siguiente, se muestra la versión de Hudi incluida en la última versión de la serie Amazon EMR 5.x, junto con los componentes que Amazon EMR instala con Hudi.
Para ver la versión de los componentes instalados con Hudi en esta versión, consulte Versiones del componente de la versión 5.36.2.
Etiqueta de versión de Amazon EMR | Versión de Hudi | Componentes instalados con Hudi |
---|---|---|
emr-5.36.2 |
Hudi 0.10.1-amzn-1 |
Not available. |