Hudi 사용하기 CLI - 아마존 EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Hudi 사용하기 CLI

Hudi를 사용하여 Hudi 데이터세트를 CLI 관리하여 커밋, 파일 시스템, 통계 등에 대한 정보를 볼 수 있습니다. 를 사용하여 수동으로 압축을 수행하거나, 압축을 예약하거나, CLI 예약된 압축을 취소할 수도 있습니다. 자세한 내용은 Apache Hudi 설명서의 통한 CLI 상호 작용을 참조하십시오.

CLIHudi를 시작하고 데이터세트에 연결하려면
  1. 를 사용하여 마스터 노드에 연결합니다SSH. 자세한 내용은 Amazon EMR 관리 안내서를 사용하여 SSH 마스터 노드에 연결을 참조하십시오.

  2. 명령줄에 /usr/lib/hudi/cli/bin/hudi-cli.sh를 입력합니다.

    명령 프롬프트가 이렇게 바뀝니다. hudi->

  3. 다음 코드를 입력하여 데이터 세트에 연결합니다. Replace s3://DOC-EXAMPLE-BUCKET/myhudidataset 작업하려는 데이터세트의 경로를 입력하십시오. 여기서 사용하는 값은 이전 예에서 설정한 값과 동일합니다.

    connect --path s3://DOC-EXAMPLE-BUCKET/myhudidataset

    다음 예와 같이 연결한 데이터 세트를 포함하도록 명령 프롬프트가 변경됩니다.

    hudi:myhudidataset->