Hudi を使用する CLI - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Hudi を使用する CLI

Hudi を使用して Hudi データセットCLIを管理し、コミット、ファイルシステム、統計などに関する情報を表示できます。を使用して、圧縮を手動で実行CLIしたり、圧縮をスケジュールしたり、スケジュールされた圧縮をキャンセルしたりすることもできます。詳細については、Apache Hudi ドキュメントの「 を介したインタラクションCLI」を参照してください。

Hudi を起動CLIしてデータセットに接続するには
  1. を使用してマスターノードに接続しますSSH。詳細については、「Amazon EMR 管理ガイド」の「 を使用してマスターノードに接続するSSH」を参照してください。

  2. コマンドラインで「/usr/lib/hudi/cli/bin/hudi-cli.sh」と入力します。

    コマンドプロンプトが hudi-> に変わります。

  3. 以下のコードを入力して、データセットに接続します。置換 s3://DOC-EXAMPLE-BUCKET/myhudidataset は、使用するデータセットへのパスを指定します。使用する値は、前の例で設定した値と同じです。

    connect --path s3://DOC-EXAMPLE-BUCKET/myhudidataset

    以下の例に示すように、コマンドプロンプトが変わって、接続されているデータセットが表示されます。

    hudi:myhudidataset->