Benutze den Hudi CLI - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Benutze den Hudi CLI

Sie können das Hudi verwendenCLI, um Hudi-Datensätze zu verwalten, um Informationen über Commits, das Dateisystem, Statistiken und mehr anzuzeigen. Sie können den auch verwenden, um Verdichtungen manuell durchzuführenCLI, Komprimierungen zu planen oder geplante Verdichtungen abzubrechen. Weitere Informationen finden Sie unter Interacting via CLI in der Apache Hudi-Dokumentation.

Um Hudi zu starten CLI und eine Verbindung zu einem Datensatz herzustellen
  1. Connect zum Master-Knoten her mitSSH. Weitere Informationen finden Sie unter Connect dem Master-Knoten herstellen SSH im Amazon EMR Management Guide.

  2. Geben Sie in die Befehlszeile /usr/lib/hudi/cli/bin/hudi-cli.sh ein.

    Die Eingabeaufforderung ändert sich in hudi->.

  3. Geben Sie den folgenden Code ein, um eine Verbindung mit einem Dataset herzustellen. Ersetzen s3://DOC-EXAMPLE-BUCKET/myhudidataset mit dem Pfad zu dem Datensatz, mit dem Sie arbeiten möchten. Der von uns verwendete Wert entspricht dem Wert, der in früheren Beispielen festgelegt wurde.

    connect --path s3://DOC-EXAMPLE-BUCKET/myhudidataset

    Die Eingabeaufforderung ändert sich, um das Dataset einzuschließen, mit dem Sie verbunden sind, wie im folgenden Beispiel gezeigt.

    hudi:myhudidataset->