As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Criação de um caderno no EMR Studio
nota
Os cadernos do EMR estão disponíveis como Workspaces do EMR Studio no console. O botão Criar Workspace no console permite criar cadernos. Para acessar ou criar Workspaces, os usuários dos Cadernos do EMR precisam de permissões adicionais de perfil do IAM. Para obter mais informações, consulte Amazon EMR Notebooks are Amazon EMR Studio Workspaces in the console e console do Amazon EMR.
Você cria um Caderno do EMR usando o console antigo do Amazon EMR. Não há suporte para a criação de cadernos usando a AWS CLI ou a API do Amazon EMR.
Para criar um notebook do EMR
Abra o console do Amazon EMR em https://console.aws.amazon.com/elasticmapreduce/
. -
Escolha Notebooks (Blocos de anotações, Create notebook (Criar bloco de anotações).
-
Insira um Notebook name (Nome do bloco de anotações) e uma Notebook description (Descrição do bloco de anotações) adicional.
-
Se você tiver um cluster ativo ao qual deseja anexar o caderno, deixe o padrão Escolher um cluster existente selecionado, clique em Escolher, selecione um cluster na lista e, em seguida, clique em Escolher cluster. Para obter informações sobre os requisitos de cluster para Cadernos do EMR, consulte Requisitos, diferenças nas versões de lançamento e segurança para cadernos do EMR.
—ou—
Escolha Criar um cluster, insira um Nome de cluster e escolha opções de acordo com as diretrizes a seguir. O cluster é criado na VPC padrão para a conta usando instâncias sob demanda.
Configuração Descrição Nome do cluster
O nome amigável usado para identificar o cluster.
Versão
Não pode ser modificado. O padrão é a versão mais recente do Amazon EMR (5.36.2).
Aplicativos
Não pode ser modificado. Lista os aplicativos instalados no cluster.
Instância
Insira o número de instâncias e selecione o tipo de instância do EC2. Uma instância é usada para o nó primário. O resto é usado para nós core. O tipo de instância determina o número de blocos de anotações que podem ser anexados ao cluster simultaneamente. Para ter mais informações, consulte Limites para Cadernos do EMR anexados simultaneamente.
Função do EMR
Deixe o padrão ou escolha o link para especificar um perfil de serviço personalizado para o Amazon EMR. Para ter mais informações, consulte Função de serviço para a Amazon EMR (EMRfunção).
Perfil de instância do EC2
Deixe o padrão ou escolha o link para especificar uma função de serviço personalizada para instâncias do EC2. Para ter mais informações, consulte Função de serviço para EC2 instâncias de cluster (perfil de EC2 instância).
EC2 key pair
Escolha um par de chaves do EC2 para poder se conectar a instâncias de cluster. Para ter mais informações, consulte Conecte-se ao nó primário EMR do cluster Amazon usando SSH.
Encerramento automático O encerramento automático é compatível com as versões 5.30.0 e 6.1.0 e posteriores do Amazon EMR. Marque a caixa de seleção para habilitar o encerramento automático e, em seguida, especifique o tempo de inatividade após o qual o cluster deverá ser desligado automaticamente. Para ter mais informações, consulte Usando uma política de encerramento automático para limpeza de EMR clusters da Amazon.
-
Em Security groups (Grupos de segurança), escolha Use default security groups (Usar grupos de segurança padrão). Como alternativa, escolha Escolher grupos de segurança e selecione grupos de segurança personalizados que estão disponíveis na VPC do cluster. Selecione um grupo para a instância primária e outro para a instância do cliente do caderno. Para ter mais informações, consulte Especificando grupos EC2 de segurança para notebooks EMR.
-
Em Perfil de serviço da AWS, deixe o padrão ou escolha um perfil personalizado na lista. A instância do cliente do bloco de anotações usa essa função. Para ter mais informações, consulte Função de serviço para EMR notebooks.
-
Em Local do caderno, escolha o local no Amazon S3 no qual o arquivo de caderno será salvo ou especifique seu próprio local. Se o bucket e a pasta não existirem, o Amazon EMR os criará.
O Amazon EMR cria uma pasta com o ID do caderno como nome da pasta e salva o caderno em um arquivo chamado
. Por exemplo, se você especificar o local do Amazon S3NotebookName
.ipynbs3://amzn-s3-demo-bucket/MyNotebooks
para um caderno chamadoMyFirstEMRManagedNotebook
, o arquivo de caderno será salvo ems3://amzn-s3-demo-bucket/MyNotebooks/
.NotebookID
/MyFirstEMRManagedNotebook.ipynbSe você especificar um local criptografado no Amazon S3, deverá configurar o Função de serviço para EMR notebooks como um usuário da chave. A função de serviço padrão é
EMR_Notebooks_DefaultRole
. Se você estiver usando uma chave do AWS KMS para criptografia, consulte Using key policies in AWS KMS no Guia do desenvolvedor do AWS Key Management Service e o artigo de suporte para adicionar usuários da chave. -
Como opção, se você adicionou um repositório baseado em Git ao Amazon EMR que deseja associar a este caderno, escolha Repositório Git, selecione Escolher repositório e, em seguida, escolha um repositório na lista. Para ter mais informações, consulte Associação de repositórios baseados em Git a Cadernos do EMR.
-
Opcionalmente, selecione Tags e, em seguida, adicione as tags de chave-valor adicionais para o bloco de anotações.
Importante
Uma tag padrão com a string Key (Chave) definida como
creatorUserID
e o valor definido como o ID de usuário do IAM são aplicados para fins de acesso. Recomendamos que você não altere nem remova essa tag, pois ela pode ser usada para controlar o acesso. Para ter mais informações, consulte Use tags de cluster e notebook com IAM políticas para controle de acesso. -
Selecione Criar bloco de anotações.