Compreensão das noções básicas do Workspace - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Compreensão das noções básicas do Workspace

Ao usar um EMR Studio, é possível criar e configurar diferentes Workspaces para organizar e executar cadernos. Esta seção aborda como criar e trabalhar com Workspaces. Para obter uma visão geral conceitual, consulte Workspaces na página Como o Amazon EMR Studio funciona.

Criação de um Workspace do EMR Studio

Você pode criar Workspaces do EMR Studio para executar códigos de cadernos usando a interface do EMR Studio.

Criar um Workspace em um EMR Studio
  1. Faça login no seu EMR Studio.

  2. Escolha Criar um Workspace.

  3. Insira um Nome do WorkSpace e uma Descrição. Nomear um Workspace ajuda a identificá-lo na página Workspaces.

  4. Se desejar trabalhar com outros usuários do Studio neste Workspace em tempo real, habilite a colaboração no Workspace. Você pode configurar colaboradores depois de iniciar o Workspace.

  5. Se desejar anexar um cluster a um Workspace, expanda a seção Configuração avançada. Você pode anexar um cluster posteriormente, se preferir. Para ter mais informações, consulte Anexar uma computação a um Workspace do EMR Studio.

    nota

    Para provisionar um novo cluster, você precisa receber permissões de acesso por parte do administrador.

    Escolha uma das opções de cluster para o Workspace e anexe o cluster. Para obter mais informações sobre o provisionamento de um cluster ao criar um Workspace, consulte Criar e anexar um novo cluster do EMR a um Workspace do EMR Studio.

  6. Escolha Criar um Workspace no canto inferior direito da página.

Após a criação de um Workspace, o EMR Studio abrirá a página Workspaces. Você visualizará um banner verde representando o êxito na parte superior da página e poderá encontrar o Workspace recém-criado na lista.

Por padrão, um Workspace é compartilhado e pode ser visualizado por todos os usuários do Studio. No entanto, somente um usuário pode abrir e trabalhar em um Workspace por vez. Para trabalhar simultaneamente com outros usuários, é possível realizar a Configuração da colaboração no Workspace.

Inicialização de um WorkSpace

Para começar a trabalhar com arquivos de cadernos, inicie um Workspace para acessar o editor de caderno. A página Workspaces em um Studio lista todos os Workspaces aos quais você tem acesso com detalhes, incluindo Nome, Status, Horário de criação e Última modificação.

nota

Se você tinha Cadernos do EMR no console antigo do Amazon EMR, poderá localizá-los no novo console como Workspaces do EMR Studio. Os usuários de Cadernos do EMR precisam de permissões adicionais de perfil do IAM para acessar ou criar Workspaces. Se você criou recentemente um caderno no console antigo, talvez seja necessário atualizar a lista Workspaces para visualizá-lo no novo console. Para obter mais informações sobre a transição, consulte Os notebooks Amazon EMR estão disponíveis como Amazon EMR Studio Workspaces no console. e Console do Amazon EMR.

Iniciar um Workspace para edição e execução de cadernos
  1. Na página Workspaces do seu Studio, localize o Workspace. Você pode filtrar a lista por palavra-chave ou por valor de coluna.

  2. Escolha o nome do Workspace para iniciá-lo em uma nova guia do navegador. Pode demorar alguns minutos para o Workspace abrir, se ele estiver Ocioso. Como alternativa, selecione a linha para o Workspace e, em seguida, escolha Iniciar o Workspace. É possível escolher entre as seguintes opções de inicialização:

    • Início rápido: inicie rapidamente seu Workspace com as opções padrão. Escolha Início rápido se quiser anexar clusters ao espaço de trabalho em JupyterLab.

    • Início com opções: inicie seu Workspace com opções personalizadas. Você pode optar por iniciar no Jupyter ou JupyterLab anexar seu espaço de trabalho a um cluster do EMR e selecionar seus grupos de segurança.

    nota

    Somente um usuário pode abrir e trabalhar em um Workspace por vez. Se você selecionar um Workspace que já esteja em uso, o EMR Studio exibirá uma notificação quando você tentar abri-lo. A coluna Usuário na página Workspaces mostra o usuário que está trabalhando no Workspace.

Compreensão da interface do usuário do Workspace

A interface do usuário do EMR Studio Workspace é baseada na JupyterLabinterface com guias indicadas por ícones na barra lateral esquerda. Ao colocar o cursor do mouse sobre um ícone, você visualizará uma descrição que mostra o nome da guia. Escolha as guias na barra lateral à esquerda para acessar os painéis apresentados a seguir.

  • Navegador de arquivos: exibe os arquivos e diretórios no Workspace, bem como os arquivos e diretórios de repositórios Git vinculados.

  • Kernels e terminais em execução: lista todos os kernels e os terminais em execução no Workspace. Para obter mais informações, consulte Gerenciando kernels e terminais na documentação oficial JupyterLab .

  • Git: fornece uma interface gráfica do usuário para a execução de comandos nos repositórios Git anexados ao Workspace. Esse painel é uma JupyterLab extensão chamada jupyterlab-git. Para obter mais informações, consulte jupyterlab-git.

  • Clusters do EMR: permitem anexar ou desanexar um cluster do Workspace para executar o código do caderno. O painel de configuração do cluster do EMR também fornece opções de configurações avançadas para ajudar você a criar e anexar um novo cluster ao Workspace. Para ter mais informações, consulte Criar e anexar um novo cluster do EMR a um Workspace do EMR Studio.

  • Repositório Git do Amazon EMR: ajuda você a vincular o Workspace a até três repositórios Git. Para obter detalhes e instruções, consulte Vinculação de repositórios baseados em Git a um Workspace do EMR Studio.

  • Exemplos de cadernos: fornece uma lista de exemplos de cadernos que você pode salvar no Workspace. Você também pode acessar os exemplos ao escolher Exemplos de cadernos na página Inicializador do Workspace.

  • Comandos — Oferece uma forma orientada pelo teclado de pesquisar e executar comandos. JupyterLab Para obter mais informações, consulte a página da paleta Command na JupyterLab documentação.

  • Ferramentas do caderno: permite selecionar e definir opções, como o tipo de deslizamento da célula e os metadados. A opção Ferramentas do caderno aparece na barra lateral à esquerda depois que você abre um arquivo de caderno.

  • Guias abertas: lista os documentos e as atividades abertos na área de trabalho principal para que você possa acessar uma guia aberta. Para obter mais informações, consulte a página do modo Tabulações e documento único na JupyterLab documentação.

  • Colaboração: permite habilitar ou desabilitar a colaboração no Workspace e gerenciar colaboradores. Para visualizar o painel Colaboração, você deve ter as permissões necessárias. Para obter mais informações, consulte Definição de propriedade para colaboração no Workspace.

Exploração de exemplos de cadernos

Cada Workspace do EMR Studio inclui um conjunto de exemplos de cadernos que você pode usar para explorar os recursos do EMR Studio. Para editar ou executar um exemplo de caderno, você pode salvá-lo no Workspace.

Salvar um exemplo de caderno em um Workspace
  1. Na barra lateral à esquerda, escolha a guia Exemplos de cadernos para abrir o painel Exemplos de cadernos. Você também pode acessar os exemplos ao escolher Exemplos de cadernos na página Inicializador do Workspace.

  2. Escolha um exemplo de caderno para visualizá-lo previamente na área de trabalho principal. O exemplo é somente para leitura.

  3. Para salvar o exemplo de caderno no Workspace, escolha Salvar no Workspace. O EMR Studio salva o exemplo em seu diretório inicial. Depois de salvar um exemplo de caderno no Workspace, você poderá renomeá-lo, editá-lo e executá-lo.

Para obter mais informações sobre os exemplos de notebooks, consulte o repositório de exemplos GitHub de notebooks do EMR Studio.

Salvamento de conteúdo do Workspace

Quando você trabalha no editor de caderno de um Workspace, o EMR Studio salva o conteúdo das células de cadernos e a saída para você no local do Amazon S3 associado ao Studio. Este processo de backup preserva o trabalho entre as sessões.

Você também pode salvar um caderno ao pressionar CTRL+S na guia do caderno que está aberta ou ao usar uma das opções de salvamento em Arquivo.

Outra maneira de fazer backup dos arquivos de cadernos em um Workspace é associar o Workspace a um repositório baseado em Git e sincronizar suas alterações com o repositório remoto. Isso também permite salvar e compartilhar cadernos com membros da equipe que usam um Workspace ou um Studio diferente. Para obter instruções, consulte Vinculação de repositórios baseados em Git a um Workspace do EMR Studio.

Exclusão de um Workspace e de arquivos de cadernos

Ao excluir um arquivo de caderno de um Workspace do EMR Studio, você exclui o arquivo do Navegador de arquivos e o EMR Studio remove a cópia de backup no Amazon S3. Você não precisa tomar nenhuma medida adicional para evitar cobranças de armazenamento ao excluir um arquivo de um Workspace.

Quando você exclui um Workspace inteiro, seus arquivos e suas pastas de cadernos permanecerão no local de armazenamento do Amazon S3. Os arquivos continuam a acumular cobranças de armazenamento. Para evitar cobranças de armazenamento, remova todos os arquivos e as pastas de backup associados ao Workspace excluído do Amazon S3.

Excluir um arquivo de cadernos de um Workspace do EMR Studio
  1. Selecione o painel Navegador de arquivos na barra lateral à esquerda do Workspace.

  2. Selecione o arquivo ou a pasta que deseja excluir. Clique com o botão direito do mouse na sua seleção e escolha Excluir. O arquivo desaparecerá da lista. O EMR Studio removerá o arquivo ou a pasta do Amazon S3 para você.

From the Workspace UI
Exclusão de um Workspace e dos arquivos de backup associados do EMR Studio
  1. Faça login no EMR Studio com o URL de acesso do Studio e escolha Workspaces no painel de navegação à esquerda.

  2. Localize seu Workspace na lista e, em seguida, marque a caixa de seleção ao lado do nome. É possível selecionar vários Workspaces a serem excluídos ao mesmo tempo.

  3. Escolha Excluir no canto superior direito da lista Workspaces e confirme que deseja excluir os Workspaces selecionados. Escolha Delete para confirmar.

  4. Se você desejar remover os arquivos de cadernos associados ao Workspace excluído do Amazon S3, siga as instruções para Excluir objetos no Guia do usuário do console do Amazon Simple Storage Service. Se não foi você quem criou o Studio, consulte o administrador do Studio para determinar o local de backup do Amazon S3 para o Workspace excluído.

From the Workspaces list
Exclusão de um Workspace e dos arquivos de backup associados da lista Workspaces
  1. Navegue até a lista Workspaces no console.

  2. Selecione o Workspace que deseja excluir da lista e, em seguida, escolha Ações.

  3. Escolha Excluir.

  4. Se você desejar remover os arquivos de cadernos associados ao Workspace excluído do Amazon S3, siga as instruções para Excluir objetos no Guia do usuário do console do Amazon Simple Storage Service. Se não foi você quem criou o Studio, consulte o administrador do Studio para determinar o local de backup do Amazon S3 para o Workspace excluído.

Compreensão do status do Workspace

Após a criação de um Workspace do EMR Studio, ele aparecerá como uma linha na lista Workspaces em seu Studio com o nome, o status, o horário de criação e o carimbo de data/hora da última modificação. A tabela a seguir descreve os status do Workspace.

Status Descrição
Starting O Workspace está sendo preparado, mas ainda não está pronto para uso. Não é possível abrir um Workspace quando o status for Iniciando.
Ready É possível abrir o Workspace para usar o editor de caderno, mas você deve anexar o Workspace a um cluster do EMR antes de executar o código do caderno.
Anexando O Workspace está sendo anexado a um cluster.
Attached O Workspace está anexado a um cluster do EMR e pronto para que você escreva e execute o código do caderno. Se o status de um Workspace não for Anexado, você deverá anexá-lo a um cluster antes de executar o código do caderno.
Ocioso O Workspace foi interrompido. Para reativar um Workspace ocioso, selecione-o na lista Workspaces. O status é alterado de Ocioso para Iniciando e, em seguida, para Pronto quando você seleciona o Workspace.
Stopping O Workspace está sendo encerrado e será definido como Ocioso. Quando você interrompe um Workspace, ele encerra todos os kernels de cadernos correspondentes. O EMR Studio interrompe cadernos que estão ociosos há muito tempo.
Deleting Quando você exclui um Workspace, o EMR Studio o marca para exclusão e inicia o processo de exclusão. Após a conclusão do processo de exclusão, o Workspace desaparecerá da lista. Quando você exclui um Workspace, os arquivos de cadernos permanecerão no local de armazenamento do Amazon S3.

Resolução de problemas de conectividade do Workspace

Para resolver problemas de conectividade do Workspace, você pode interromper e reiniciar um Workspace. Quando você reinicia um Workspace, o EMR Studio inicia o Workspace em uma zona de disponibilidade diferente ou em uma sub-rede diferente associada ao seu Studio.

Interromper e reiniciar um Workspace do EMR Studio
  1. Feche o Workspace no seu navegador.

  2. Navegue até a lista Workspace no console.

  3. Selecione seu Workspace na lista e escolha Ações.

  4. Escolha Interromper e aguarde até que o status do Workspace seja alterado de Interrompendo para Ocioso.

  5. Escolha Ações novamente e, em seguida, selecione Iniciar para reiniciar o Workspace.

  6. Aguarde até que o status do Workspace seja alterado de Iniciando para Pronto e, em seguida, escolha o nome do Workspace para abri-lo novamente em uma nova guia do navegador.