Usa el Hudi CLI - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Usa el Hudi CLI

Puedes usar el Hudi CLI para administrar los conjuntos de datos del Hudi y ver información sobre las confirmaciones, el sistema de archivos, las estadísticas y mucho más. También puedes usarlo CLI para realizar compactaciones, programarlas o cancelar compactaciones programadas de forma manual. Para obtener más información, consulte Interactuar mediante CLI en la documentación de Apache Hudi.

Para iniciar el Hudi CLI y conectarse a un conjunto de datos
  1. Conéctese al nodo principal medianteSSH. Para obtener más información, consulte Conectarse al nodo principal mediante SSH la Guía EMR de administración de Amazon.

  2. En la línea de comandos, escriba /usr/lib/hudi/cli/bin/hudi-cli.sh.

    El símbolo del sistema cambia a hudi->

  3. Escriba el código siguiente para conectarse a un conjunto de datos. Reemplazar s3://DOC-EXAMPLE-BUCKET/myhudidataset con la ruta al conjunto de datos con el que desea trabajar. El valor que usamos es el mismo que el valor establecido en ejemplos anteriores.

    connect --path s3://DOC-EXAMPLE-BUCKET/myhudidataset

    El símbolo del sistema cambia para incluir el dataset al que está conectado, como se muestra en el siguiente ejemplo.

    hudi:myhudidataset->