(Opcional) Migre fluxos de dados do Data Wrangler no Studio Classic - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

(Opcional) Migre fluxos de dados do Data Wrangler no Studio Classic

Importante

Atualmente, a importação de arquivos de fluxo de dados para o Data Wrangler in SageMaker Canvas está ativa somente no seguinte: Regiões da AWS

  • Leste dos EUA (Norte da Virgínia)

  • Leste dos EUA (Ohio)

  • Oeste dos EUA (Oregon)

Se você já usou o Amazon SageMaker Data Wrangler no Amazon SageMaker Studio Classic para tarefas de preparação de dados, você pode migrar para o novo Amazon SageMaker Studio e acessar a versão mais recente do Data Wrangler no Amazon Canvas. SageMaker O Data Wrangler in SageMaker Canvas oferece uma experiência de usuário aprimorada e acesso aos recursos mais recentes, como uma interface de linguagem natural e desempenho mais rápido.

Você pode se conectar ao SageMaker Canvas a qualquer momento para começar a usar a nova experiência do Data Wrangler. Para ter mais informações, consulte Começando a usar o Amazon SageMaker Canvas.

Se você tiver arquivos de fluxo de dados salvos no Studio Classic nos quais estava trabalhando anteriormente, você pode integrá-los ao Studio e depois importar os arquivos de fluxo para o Canvas. O guia a seguir descreve como migrar seus arquivos de fluxo de dados. No Studio Classic, você pode exportar os arquivos para o Amazon S3 ou baixá-los para sua máquina local. Em seguida, você entra no aplicativo SageMaker Canvas, importa os arquivos de fluxo e continua suas tarefas de preparação de dados.

Pré-requisitos

Analise os pré-requisitos a seguir antes de começar a migrar seus arquivos de fluxo.

Etapa 1. Migre o domínio e conceda permissões

Antes de migrar arquivos de fluxo de dados, você precisa seguir etapas específicas do Migração do Amazon SageMaker Studio Classic guia para garantir que a função de execução do AWS IAM do seu perfil de usuário tenha as permissões necessárias. Siga os pré-requisitos e, Fase 1: Migrar a interface do usuário do Studio Classic para o Studio antes de continuar, que descrevem como conceder as permissões necessárias, configure o Studio como a nova experiência e migre seu domínio existente.

Especificamente, você deve ter permissões para criar um aplicativo SageMaker Canvas e usar os recursos de preparação de dados do SageMaker Canvas. Para obter essas permissões, você pode:

Certifique-se de usar o mesmo perfil de usuário para o Studio e o SageMaker Canvas.

Depois de concluir os pré-requisitos descritos no guia de migração, você deve ter um novo domínio com as permissões necessárias para acessar SageMaker o Canvas por meio do Studio.

Etapa 2. (Opcional) Prepare um local do Amazon S3

Se você planeja usar o Amazon S3 para transferir seus arquivos de fluxo em vez de usar a opção de download local, você deve ter um bucket do Amazon S3 em sua conta que gostaria de usar para armazenar os arquivos de fluxo.

Exporte os arquivos de fluxo do Studio Classic

nota

Se você já migrou seus dados do Studio Classic para o Amazon S3 seguindo as instruções Fase 3: (opcional) migrar dados do Studio Classic para o Studio em, você pode pular esta etapa e ir direto para a seção na qual você importa seus arquivos de fluxo Importe os arquivos de fluxo para o Canvas do local do Amazon S3 onde seus dados do Studio Classic estão armazenados.

Você pode exportar seus arquivos de fluxo salvando-os no Amazon S3 ou baixando-os para sua máquina local. Ao importar seus arquivos de fluxo para o SageMaker Canvas na próxima etapa, se você escolher a opção de upload local, poderá carregar apenas 20 arquivos de fluxo por vez. Se você tiver um grande número de arquivos de fluxo para importar, recomendamos que você use o Amazon S3 em vez disso.

Siga as instruções em Método 1: usar o Amazon S3 para transferir arquivos de fluxo ou Método 2: usar sua máquina local para transferir arquivos de fluxo para continuar.

Método 1: usar o Amazon S3 para transferir arquivos de fluxo

Com esse método, você usa o Amazon S3 como intermediário entre o Data Wrangler no Studio Classic e o Data Wrangler no SageMaker Canvas (acessado por meio da versão mais recente do Studio). Você exporta os arquivos de fluxo do Studio Classic para o Amazon S3 e, na próxima etapa, acessa o Canvas por meio do Studio e importa os arquivos de fluxo do Amazon S3.

Certifique-se de ter um bucket do Amazon S3 preparado como local de armazenamento para os arquivos de fluxo.

Use o procedimento a seguir para exportar seus arquivos de fluxo do Studio Classic para o Amazon S3:

  1. Abra o Studio Classic.

  2. Abra um novo terminal fazendo o seguinte:

    1. Na barra de navegação superior, escolha Arquivo.

    2. No menu de contexto, passe o mouse sobre Novo e selecione Terminal.

  3. Por padrão, o terminal deve abrir em seu diretório pessoal. Navegue até a pasta que contém todos os arquivos de fluxo que você deseja migrar.

  4. Use o comando a seguir para sincronizar todos os arquivos de fluxo com a localização especificada do Amazon S3. Substitua {bucket-name} e {folder} pelo caminho para a localização desejada do Amazon S3. Para obter mais informações sobre o comando e os parâmetros, consulte o comando sync na Referência de AWS AWS CLI comandos.

    aws s3 sync . s3://{bucket-name}/{folder}/ --exclude "*.*" --include "*.flow"

    Se você estiver usando o seu próprio AWS KMS key, use o comando a seguir para sincronizar os arquivos e especificar sua ID da chave KMS. Certifique-se de que a função de execução do IAM do usuário (que deve ser a mesma função usada na Etapa 1). Migrar o domínio e conceder permissões (dos pré-requisitos anteriores) recebeu acesso para usar a chave KMS.

    aws s3 sync . s3://{bucket-name}/{folder}/ --exclude "*.*" --include "*.flow" --sse-kms-key-id {your-key-id}

Seus arquivos de fluxo agora devem ser exportados. Você pode verificar seu bucket do Amazon S3 para garantir que os arquivos de fluxo tenham sido sincronizados com sucesso.

Para importar esses arquivos na versão mais recente do Data Wrangler, siga as etapas em. Importe os arquivos de fluxo para o Canvas

Método 2: usar sua máquina local para transferir arquivos de fluxo

Com esse método, você baixa os arquivos de fluxo do Studio Classic para sua máquina local. Você pode baixar os arquivos diretamente ou compactá-los como um arquivo zip. Em seguida, você descompacta o arquivo zip localmente (se aplicável), entra no Canvas e importa os arquivos de fluxo carregando-os da sua máquina local.

Use o procedimento a seguir para baixar seus arquivos de fluxo do Studio Classic:

  1. Abra o Studio Classic.

  2. (Opcional) Se você quiser compactar vários arquivos de fluxo em um arquivo zip e baixá-los todos de uma vez, faça o seguinte:

    1. Na barra de navegação superior do Studio Classic, escolha Arquivo.

    2. No menu de contexto, passe o mouse sobre Novo e selecione Terminal.

    3. Por padrão, o terminal é aberto no seu diretório pessoal. Navegue até a pasta que contém todos os arquivos de fluxo que você deseja migrar.

    4. Use o comando a seguir para compactar os arquivos de fluxo no diretório atual como um zip. O comando exclui todos os arquivos ocultos:

      find . -not -path "*/.*" -name "*.flow" -print0 | xargs -0 zip my_archive.zip
  3. Faça o download do arquivo zip ou dos arquivos de fluxo individuais para sua máquina local fazendo o seguinte:

    1. No painel de navegação esquerdo do Studio Classic, escolha Navegador de arquivos.

    2. Encontre o arquivo que você deseja baixar no navegador de arquivos.

    3. Clique com o botão direito do mouse no arquivo e, no menu de contexto, selecione Baixar.

O arquivo deve ser baixado para sua máquina local. Se você os empacotou como um arquivo zip, extraia os arquivos localmente. Depois que os arquivos forem extraídos, para importá-los na versão mais recente do Data Wrangler, siga as etapas em. Importe os arquivos de fluxo para o Canvas

Importe os arquivos de fluxo para o Canvas

Depois de exportar seus arquivos de fluxo, acesse o Canvas pelo Studio e importe os arquivos.

Use o procedimento a seguir para importar arquivos de fluxo para o Canvas:

  1. Abra sua versão mais recente do Studio.

  2. No Studio, no painel Aplicativos, escolha Canvas.

  3. Na página Canvas, escolha Executar Canvas. Se você configurou com sucesso as permissões, isso cria um aplicativo Canvas para você. O aplicativo Canvas pode levar alguns minutos até ficar pronto.

  4. Quando o Canvas estiver pronto, escolha Abrir tela.

  5. No painel de navegação esquerdo do Canvas, escolha Data Wrangler.

  6. No painel superior, escolha Importar fluxos de dados.

  7. Em Fonte de dados, escolha Amazon S3 ou upload local.

  8. Selecione seus arquivos de fluxo do bucket do Amazon S3 ou faça o upload dos arquivos da sua máquina local.

    nota

    Para upload local, você pode carregar no máximo 20 arquivos de fluxo por vez. Para importações maiores, use o Amazon S3. Se você selecionar uma pasta para importar, todos os arquivos de fluxo em subpastas também serão importados.

  9. Escolha Importar dados.

Se a importação for bem-sucedida, você receberá uma notificação de que X vários arquivos de fluxo foram importados com êxito.

Caso seus arquivos de fluxo não sejam importados com sucesso, você receberá uma notificação no aplicativo SageMaker Canvas. Escolha Exibir erros na mensagem de notificação para verificar as mensagens de erro individuais e obter orientação sobre como reformatar qualquer arquivo de fluxo formatado incorretamente.

Depois que a importação dos arquivos de fluxo for concluída, acesse a página Data Wrangler do aplicativo SageMaker Canvas para visualizar seus fluxos de dados. Você pode tentar abrir um fluxo de dados para verificar se ele tem a aparência esperada.