Personalizar uma instância de caderno usando um script de configuração do ciclo de vida - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Personalizar uma instância de caderno usando um script de configuração do ciclo de vida

Para instalar pacotes ou exemplos de cadernos na sua instância de caderno, configure as redes e a segurança dela, ou use um script de shell para personalizá-la, e use uma configuração de ciclo de vida. Uma configuração de ciclo de vida fornece scripts de shell que são executados apenas quando você cria ou inicia a instância de caderno. Ao criar uma instância de caderno, você pode criar uma nova configuração de ciclo de vida e os scripts que ela usa. Alternativamente, é possível aplicar uma já existente.

Também é possível usar um script de configuração do ciclo de vida para acessar os serviços da AWS do seu caderno. Por exemplo, você pode criar um script que permite usar seu caderno para controlar outros recursos da AWS, como uma instância do Amazon EMR.

Mantemos um repositório público de scripts de configuração do ciclo de vida do notebook que abordam casos de uso comuns para personalizar instâncias do notebook em https://github.com/aws-samples/ -. amazon-sagemaker-notebook-instance lifecycle-configuration-samples

nota

Cada script tem um limite de 16.384 caracteres.

O valor da variável de ambiente $PATH que está disponível para ambos os scripts é /usr/local/sbin:/usr/local/bin:/usr/bin:/usr/sbin:/sbin:/bin. O diretório de trabalho, que é o valor da variável de ambiente $PWD é /.

Visualize CloudWatch os registros das configurações do ciclo de vida da instância do notebook no grupo /aws/sagemaker/NotebookInstances de registros no fluxo de registros. [notebook-instance-name]/[LifecycleConfigHook]

Scripts não podem ser executados por mais de 5 minutos. Se um script for executado por mais de 5 minutos, haverá falha e a instância de caderno não será criada nem iniciada. Para ajudar a diminuir o tempo de execução de scripts, tente o seguinte:

  • Reduza as etapas necessárias. Por exemplo, limite os ambientes conda nos quais instalar pacotes grandes.

  • Execute tarefas em processos paralelos.

  • Use o comando nohup no seu script.

Você pode ver uma lista das configurações do ciclo de vida da instância do notebook que você criou anteriormente escolhendo a configuração do ciclo de vida no console. SageMaker Você pode anexar uma configuração de ciclo de vida de instância de caderno ao criar uma nova instância de caderno. Para ter mais informações sobre como criar uma instância de caderno, consulte Criar uma instância de caderno.

Para criar uma configuração de ciclo de vida
  1. Abra o SageMaker console em https://console.aws.amazon.com/sagemaker/.

  2. No painel de navegação à esquerda, escolha Configurações do administrador.

  3. Em Configurações administrativas, escolha Configurações do ciclo de vida.

  4. Na página Configurações do ciclo de vida, escolha a aba Instância do caderno.

  5. Escolha Criar configuração.

  6. Em Nome, digite um nome usando caracteres alfanuméricos e “-”, mas sem espaços. Um rótulo pode ter no máximo 63 caracteres.

  7. (Opcional) Para criar um script que é executado na criação do caderno e toda vez que ele for iniciado, escolha Start notebook (Iniciar caderno).

  8. No editor Start notebook (Iniciar caderno), digite o script.

  9. (Opcional) Para criar um script que é executado apenas uma vez, na criação do caderno, escolha Create notebook (Criar caderno).

  10. No editor Create notebook (Criar caderno), digite o script de configuração das redes.

  11. Escolha Criar configuração.