Usando a Amazon SageMaker Feature Store no console - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usando a Amazon SageMaker Feature Store no console

Importante

IAMPolíticas personalizadas que permitem que o Amazon SageMaker Studio ou o Amazon SageMaker Studio Classic criem SageMaker recursos da Amazon também devem conceder permissões para adicionar tags a esses recursos. A permissão para adicionar tags aos recursos é necessária porque o Studio e o Studio Classic marcam automaticamente todos os recursos que eles criam. Se uma IAM política permitir que o Studio e o Studio Classic criem recursos, mas não permita a marcação, erros AccessDenied "" podem ocorrer ao tentar criar recursos. Para obter mais informações, consulte Forneça permissões para marcar recursos SageMaker.

AWS Políticas gerenciadas para a Amazon SageMakerque dão permissões para criar SageMaker recursos já incluem permissões para adicionar tags ao criar esses recursos.

Você pode usar a Amazon SageMaker Feature Store no console para criar, visualizar, atualizar e monitorar seus grupos de recursos. O monitoramento neste guia inclui a visualização das execuções do pipeline e da linhagem de seus grupos de recursos. Este guia fornece instruções sobre como realizar essas tarefas no console.

Para exemplos e recursos da Feature Store usando a Amazon SageMaker APIs e AWS SDK for Python (Boto3), consulteRecursos da Amazon SageMaker Feature Store.

Crie um grupo de recursos a partir do console

O processo de criação de grupos de atributos tem quatro etapas:

  1. Inserir as informações do grupo de atributos.

  2. Inserir as definições dos atributos.

  3. Inserir os atributos necessários.

  4. Inserir as tags do grupo de atributos.

Considere qual das seguintes opções se adequa ao seu caso de uso:

  • Crie um armazenamento on-line, um armazenamento offline ou ambos. Para obter mais informações sobre as diferenças entre lojas on-line e off-line, consulteConceitos do Feature Store.

  • Use uma AWS Key Management Service chave padrão ou sua própria KMS chave. A chave padrão é a AWS KMS chave (SSE-KMS). Você pode reduzir os custos de AWS KMS solicitação configurando o uso das chaves de bucket do Amazon S3 na loja off-line do Amazon S3 bucket. A chave de bucket do Amazon S3 deve ser habilitada antes de usar o bucket para seus grupos de recursos. Para obter mais informações sobre como reduzir o custo usando as chaves de bucket do Amazon S3, consulte Reduzindo o custo de SSE - KMS com as chaves de bucket do Amazon S3.

    Você pode usar a mesma chave para armazenamento on-line e offline ou ter uma chave exclusiva para cada um. Para obter mais informações sobre AWS KMS, consulte AWS Key Management Service.

  • Se você criar um armazenamento offline:

    • Decida se você deseja criar um bucket do Amazon S3 ou usar um existente. Ao usar um existente, você deve saber o bucket do Amazon S3 URL ou o nome do bucket do Amazon S3 e o nome do diretório do conjunto de dados, se aplicável.

    • Escolha qual nome de recurso da Amazon (ARN) usar para especificar a IAM função. Para obter mais informações sobre como encontrar sua função e as políticas anexas, consulteAdicionar políticas à sua IAM função.

    • Decida se deseja usar o AWS Glue (padrão) ou Apache Iceberg formato de tabela. Na maioria dos casos de uso, você usa o Apache Iceberg formato de tabela. Para obter mais informações sobre formatos de tabela, consulteUse o Feature Store com SDK para Python (Boto3).

Você pode usar o console para visualizar a linhagem de um grupo de recursos. As instruções para usar a Feature Store no console variam dependendo se você SageMaker Estúdio Amazon ativou ou Amazon SageMaker Studio Clássico como sua experiência padrão.

  1. Abra o console do Studio seguindo as instruções emInicie o Amazon SageMaker Studio.

  2. Escolha Dados no painel de navegação esquerdo para expandir a lista suspensa.

  3. Na lista suspensa, escolha Feature Store.

  4. Escolha Criar grupo de atributos.

  5. Em Detalhes do grupo de atributos, insira um nome de grupo de atributos.

  6. (Opcional) Insira uma descrição do grupo de atributos.

  7. Em Configuração de armazenamento do grupo de recursos, escolha uma configuração de armazenamento na lista suspensa. Para obter informações sobre configurações de armazenamento, consulteConfigurações de armazenamento do Feature Store.

  8. Se você optou por ativar o armazenamento on-line:

    1. Se você ativar apenas o armazenamento on-line, poderá escolher um tipo de armazenamento na lista suspensa. Para obter informações sobre os tipos de armazenamento da loja virtual, consulteArmazenamento on-line.

    2. (Opcional) Aplique Time to Live (TTL) alternando o botão para Ativado e especificando o valor e a unidade da duração do Time to Live. Isso atualizará a TTL duração padrão de todos os registros adicionados ao grupo de recursos após a criação do grupo de recursos. Para obter mais informações sobreTTL, consulteDuração do tempo de vida (TTL) para registros.

  9. Se você optou por ativar o armazenamento off-line:

    1. Sob o nome do bucket do Amazon S3, insira um novo nome de bucket ou insira um bucket existente manualmenteURL.

    2. Na lista suspensa Formato de tabela, escolha o formato da tabela. Na maioria dos casos de uso, você deve usar o Apache Iceberg formato de tabela. Para obter mais informações sobre formatos de tabela, consulteUse o Feature Store com SDK para Python (Boto3).

    3. Em IAMfunção ARN, escolha a IAM função ARN que você deseja anexar a esse grupo de recursos. Para obter mais informações sobre como encontrar sua função e as políticas anexas, consulteAdicionar políticas à sua IAM função.

    4. Se você optou por habilitar o formato de tabela de armazenamento offline e o formato de tabela AWS Glue (padrão), em Catálogo de dados, você pode escolher uma das duas opções a seguir:

      • Use valores padrão para seu AWS Glue Data Catalog.

      • Forneça o nome do catálogo de dados existente, o nome da tabela e o nome do banco de dados para estender o existente AWS Glue Data Catalog.

  10. Na lista suspensa Chave de criptografia da loja virtual ou Chave de criptografia da loja off-line, escolha uma das seguintes opções:

    • Uso AWS gerenciado AWS KMS key (padrão)

    • Insira um AWS KMS key ARN e insira sua AWS KMS chave ARN em Chave de criptografia da loja offline ARN. Para obter mais informações sobre AWS KMS, consulte AWS Key Management Service.

  11. Se aplicável, você terá a opção de escolher o modo de taxa de transferência, que afeta a forma como você é cobrado. Em Modo de taxa de transferência, escolha um modo na lista suspensa e insira as capacidades de leitura e gravação quando disponíveis. Para obter informações sobre os modos de taxa de transferência, como quando o modo pode ser aplicado e as unidades de capacidade, consulteModos de taxa de transferência.

  12. Depois de especificar todas as informações necessárias, o botão Continuar aparece disponível. Escolha Continuar.

  13. Em Especificar definições de recursos, você tem duas opções para fornecer um esquema para seus recursos: um JSON editor ou um editor de tabela.

    • JSONeditor: na JSONguia, insira ou copie e cole suas definições de recursos no JSON formato.

    • Editor de tabela: na guia Tabela, insira o nome do recurso e escolha o tipo de dados correspondente para cada recurso em seu grupo de recursos. Escolha + Adicionar definições de atributos para incluir mais atributos. Esteja ciente de que você não pode remover definições de recursos de seus grupos de recursos. No entanto, você pode adicionar e atualizar as definições de recursos após a criação do grupo de recursos.

    Deve haver pelo menos dois recursos em um grupo de recursos que representem o identificador do registro e a hora do evento:

    • O tipo de recurso de registro pode ser uma string, fracionário ou integral.

    • O tipo de recurso da hora do evento deve ser uma sequência de caracteres ou uma fração. No entanto, se você escolher o Iceberg formato de tabela, a hora do evento deve ser uma string.

  14. Depois que todos os recursos estiverem incluídos, escolha Continuar.

  15. Em Selecionar recursos necessários, você deve especificar o identificador de registro e os recursos de horário do evento. Faça isso escolhendo o nome do recurso nas listas suspensas Nome do recurso do identificador de registro e Nome do recurso Hora do evento, respectivamente.

  16. Depois de escolher o identificador de registro e os recursos de horário do evento, escolha Continuar.

  17. (Opcional) Para adicionar tags ao grupo de recursos, escolha Adicionar nova tag. Em seguida, insira uma chave de tag e o valor correspondente em Chave e Valor, respectivamente.

  18. Escolha Continuar.

  19. Em Revisar grupo de atributos, revise as informações do grupo de atributos. Para editar qualquer etapa, escolha o botão Editar que corresponde a essa etapa. Isso leva você à etapa correspondente para edição. Para retornar à etapa 5, escolha Continuar até retornar à etapa 5.

  20. Depois de finalizar a configuração do seu grupo de recursos, escolha Criar grupo de recursos.

    Se ocorrer um problema durante a configuração, uma mensagem de alerta pop-up aparecerá na parte inferior da página com dicas para resolver o problema. Você pode retornar às etapas anteriores para corrigir os problemas escolhendo Editar para a etapa com conflitos.

    Depois que o grupo de recursos for criado com sucesso, uma mensagem pop-up verde aparecerá na parte inferior da página. O novo grupo de recursos também aparece no seu catálogo de grupos de recursos.

Exibir detalhes do grupo de recursos no console

Você pode ver detalhes dos seus grupos de recursos depois que um grupo de recursos for criado com sucesso na Feature Store.

Você pode usar o console ou a Amazon SageMaker Feature Store API para ver os detalhes do seu grupo de recursos. As instruções para usar a Feature Store por meio do console dependem de você ter ativado SageMaker Estúdio Amazon ou Amazon SageMaker Studio Clássico como sua experiência padrão.

  1. Abra o console do Studio seguindo as instruções emInicie o Amazon SageMaker Studio.

  2. Escolha Dados no painel de navegação esquerdo para expandir a lista suspensa.

  3. Na lista suspensa, escolha Feature Store.

  4. (Opcional) Para visualizar seus grupos de recursos, escolha Minha conta. Para ver grupos de recursos compartilhados, escolha Conta cruzada.

  5. Na guia Catálogo de grupos de atributos, escolha o nome do grupo de atributos na lista. Isso abre a página do grupo de atributos.

  6. Na guia Atributos, você pode encontrar uma lista de todos os atributos. Use o filtro para refinar sua lista. Escolha um atributo para visualizar seus detalhes.

  7. Na guia Detalhes e na subguia Informações, você pode revisar as informações do seu grupo de recursos. Isso inclui execução mais recente, configurações de armazenamento off-line, configurações de armazenamento on-line e muito mais.

  8. Na guia Detalhes e na subguia Tags, você pode revisar as tags do seu grupo de recursos. Escolha Adicionar nova tag para adicionar uma nova tag ou Remover para remover uma tag.

  9. Na guia Execuções de pipeline, você pode visualizar os pipelines associados ou as execuções de pipeline para seu grupo de recursos.

  10. Na guia Linhagem, você pode ver a linhagem do seu grupo de recursos.

Atualizar um grupo de recursos do console

Você pode atualizar seus grupos de recursos depois que um grupo de recursos for criado com sucesso na Feature Store.

Você pode usar o console ou a Amazon SageMaker Feature Store API para atualizar um grupo de recursos. As instruções para usar a Feature Store por meio do console dependem de você ter ativado SageMaker Estúdio Amazon ou Amazon SageMaker Studio Clássico como sua experiência padrão.

  1. Abra o console do Studio seguindo as instruções emInicie o Amazon SageMaker Studio.

  2. Escolha Dados no painel de navegação esquerdo para expandir a lista suspensa.

  3. Na lista suspensa, escolha Feature Store.

  4. (Opcional) Para visualizar seus grupos de recursos, escolha Minha conta. Para ver grupos de recursos compartilhados, escolha Conta cruzada.

  5. Na guia Catálogo de grupos de atributos, pesquise e escolha o nome do grupo de atributos na lista. Isso abre a página do grupo de atributos.

  6. Escolha Atualizar grupo de atributos.

  7. (Opcional) Se aplicável, você pode alterar o modo de taxa de transferência, o que afeta a forma como você é cobrado. Em Modo de taxa de transferência, escolha um modo na lista suspensa e insira as capacidades de leitura e gravação quando disponíveis. Para obter informações sobre os modos de taxa de transferência, como quando o modo pode ser aplicado e as unidades de capacidade, consulteModos de taxa de transferência.

  8. (Opcional) Se seu grupo de recursos usa a loja online, você pode atualizar o Time to Live padrão (TTL). Se TTL não tiver sido ativado para o grupo de recursos, alterne o botão de alternância em Time to Live (TTL) para Ativado. Você pode especificar o TTL valor e a unidade em Duração do Time to Live. Isso atualizará a TTL duração padrão de todos os registros adicionados ao grupo de recursos após a atualização do grupo de recursos.

  9. (Opcional) Você pode adicionar definições de atributos aos seus grupos de atributos, mas não pode removê-las do grupo de atributos. Para adicionar uma definição de recurso, escolha + Adicionar definição de recurso e, em seguida, especifique o novo nome da definição de recurso na coluna Nome e selecione o tipo de recurso na coluna Tipo de recurso.

  10. Escolha Salvar alterações.

  11. Para confirmar suas alterações, escolha Confirmar.

Veja as execuções do pipeline no console

Você pode ver as informações mais recentes de execução do pipeline para um recurso ou grupo de recursos em Execuções do pipeline. Você também pode obter links para pipelines, execuções, código e outras informações úteis sobre execução.

Você pode usar o console para ver as execuções do seu pipeline. As instruções para usar a Feature Store por meio do console dependem de você ter ativado SageMaker Estúdio Amazon ou Amazon SageMaker Studio Clássico como sua experiência padrão.

  1. Abra o console do Studio seguindo as instruções emInicie o Amazon SageMaker Studio.

  2. Escolha Dados no painel de navegação esquerdo para expandir a lista suspensa.

  3. Na lista suspensa, escolha Feature Store.

  4. (Opcional) Para visualizar seus grupos de recursos, escolha Minha conta. Para ver grupos de recursos compartilhados, escolha Conta cruzada.

  5. Escolha um grupo de recursos ou recurso para ver suas execuções de pipeline.

  6. Escolha a guia Execuções do pipeline.

  7. Pesquise um pipeline na lista suspensa Selecionar um pipeline.

  8. Você pode ver os links do pipeline, da execução e dos detalhes do código. Você também pode ver o proprietário, o status, a data e a duração da execução.

Veja a linhagem no console

Você pode visualizar a linhagem de um grupo de atributos. A linhagem inclui as informações sobre o código de execução do seu fluxo de trabalho de processamento de atributos, quais fontes de dados foram usadas e como elas são ingeridas no grupo de atributos ou no atributo.

Você pode usar o console para visualizar a linhagem de um grupo de recursos. As instruções sobre como usar a Feature Store por meio do console dependem de você ter ativado SageMaker Estúdio Amazon ou Amazon SageMaker Studio Clássico como sua experiência padrão.

  1. Abra o console do Studio seguindo as instruções emInicie o Amazon SageMaker Studio.

  2. Escolha Dados no painel de navegação esquerdo para expandir a lista suspensa.

  3. Na lista suspensa, escolha Feature Store.

  4. (Opcional) Para visualizar seus grupos de recursos, escolha Minha conta. Para ver grupos de recursos compartilhados, escolha Conta cruzada.

  5. Escolha um grupo de feições ou feição para ver os detalhes de sua linhagem.

  6. Escolha a guia Linhagem.

  7. Escolha um grupo de atributos ou um nó de pipeline para expandir o nó. Ele contém mais informações sobre um grupo de atributos ou pipeline.

  8. Você pode ampliar, reduzir ou recentralizar o gráfico de linhagem usando os botões na parte inferior esquerda da tela.

  9. Você pode percorrer o mapa de linhagem ao escolher e arrastar a tela. Para mover seus mapas de linhagem usando nós como ponto focal, você pode pressionar Tab ou Shift+Tab para alternar entre os nós.

  10. Se aplicável, você pode navegar pela linhagem a montante (à esquerda, mais cedo) ou a jusante (à direita, mais recente). Faça isso escolhendo um nó e, em seguida, escolhendo Consultar linhagem upstream ou Consultar linhagem downstream.