As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Usar a CLI do Hudi
É possível usar a CLI do Hudi para administrar conjuntos de dados do Hudi para visuaalizar informações sobre confirmações, o sistema de arquivos, estatísticas e muito mais. Você também pode usar a CLI para executar manualmente compactações, programá-las ou cancelar as compactações programadas. Para obter mais informações, consulte Interacting via CLI
Iniciar a CLI do Hudi e conectar-se a um conjunto de dados
-
Conecte-se ao nó principal usando SSH. Para obter mais informações, consulte Conectar-se ao nó principal usando SSH no Guia de gerenciamento do Amazon EMR.
-
Na linha de comando, digite
/usr/lib/hudi/cli/bin/hudi-cli.sh
.O prompt de comando muda para
hudi->
. -
Use o comando a seguir para se conectar a um conjunto de dados.
s3://amzn-s3-demo-bucket/myhudidataset
Substitua pelo caminho para o conjunto de dados com o qual você deseja trabalhar. O valor que usamos é o mesmo estabelecido em exemplos anteriores.connect --path
s3://amzn-s3-demo-bucket/myhudidataset
O prompt de comando é alterado para incluir o conjunto de dados ao qual você está conectado, conforme mostrado no exemplo a seguir.
hudi:
myhudidataset
->
Por padrão, o script hudi-cli.sh
na versão 7.3.0 do Amazon EMR usa hudi-cli-bundle.jar
. Caso tenha problemas, é possível voltar para a CLI clássica do Hudi com o seguinte comando:
/usr/lib/hudi/cli/bin/hudi-cli.sh --cliBundle false
Esse comando executa o script hudi-cli.sh
, define o sinalizador --cliBundle
e instrui a CLI a usar os arquivos JAR individuais em vez do JAR empacotado. Por padrão, o --cliBundle
é definido como verdadeiro, o que significa que a CLI usa o JAR empacotado.