Substituindo o esquema de um conjunto de dados para adicionar novas colunas - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Substituindo o esquema de um conjunto de dados para adicionar novas colunas

Depois de criar um conjunto de dados de itens ou de usuários, é possível substituir o esquema por um novo ou existente. Você poderá substituir o esquema de um conjunto de dados se sua estrutura de dados for alterada após a criação do conjunto de dados. Por exemplo, você pode ter uma nova coluna de metadados de itens que você quer que o Amazon Personalize leve em conta durante o treinamento. Ou talvez você queira adicionar uma coluna de dados a ser usada somente ao filtrar recomendações.

Ao substituir o esquema de um conjunto de dados, você deverá manter todos os campos no esquema anterior e não poderá alterar seus tipos de dados ou atributos. Depois de substituir o esquema do conjunto de dados, o Amazon Personalize exclui automaticamente quaisquer novas colunas do treinamento para quaisquer recomendadores ou soluções personalizadas existentes. Para obter mais diretrizes e requisitos, consulte Diretrizes e requisitos.

Você pode substituir o esquema de um conjunto de dados pelo console Amazon Personalize AWS Command Line Interface ,AWS CLI() e pelos SDKs. AWS

Diretrizes e requisitos

Antes de substituir o esquema para um conjunto de dados, certifique-se de estar ciente das seguintes diretrizes e requisitos:

  • Não é possível substituir o esquema de um conjunto de dados de interações com itens, de interações com ações ou de ações.

  • Você pode adicionar novos campos ao esquema substituto, mas deve manter todos os campos no esquema anterior. Não é possível alterar os tipos de dados nem atributos. Por exemplo, se o esquema anterior incluir um campoMEMBERSHIP_STATUS para dados de string categóricos, o novo esquema usado deverá incluir um campo MEMBERSHIP_STATUS com esses atributos e tipos de dados.

  • Se o esquema atual tiver um campo que você deseja renomear ou se quiser alterar seus tipos de dados ou atributos, você poderá adicionar um novo campo com um novo nome e tipos ou atributos modificados. Em seguida, inclua o novo campo no treinamento e exclua o campo antigo. Todos os novos campos devem oferecer suporte a dados null. Se o campo antigo não suportava dados nulos, ao importar dados, você pode usar dados de espaço reservado para garantir que sua importação corresponda ao esquema. Para obter informações sobre como configurar as colunas usadas por um recomendador, consulte Atualização de um recomendador. Para obter informações sobre como configurar as colunas usadas por uma solução, Configurar colunas usadas durante o treinamento.

  • Todos os novos campos devem oferecer suporte a dados null. Para obter informações sobre como adicionar um tipo nulo a um campo, consulte Tipos de dados do esquema.

  • Depois de substituir o esquema do conjunto de dados, o Amazon Personalize exclui automaticamente quaisquer novas colunas do treinamento para quaisquer recomendadores ou soluções personalizadas existentes. O uso do conjunto de dados modificado envolve as seguintes ações:

    • Para usar qualquer nova coluna no treinamento, importe dados que estejam alinhados com o novo esquema. Em seguida, atualize todos os recomendadores para usar novas colunas ou crie uma nova solução personalizada e configure as colunas que ela usa durante o treinamento.

      Para obter informações sobre como atualizar as colunas usadas por um recomendador, consulte Atualização de um recomendador. Para obter informações sobre como configurar as colunas usadas por uma solução, Configurar colunas usadas durante o treinamento.

    • Para usar qualquer coluna somente durante a filtragem, importe dados que estejam alinhados com o novo esquema, crie um filtro que use os novos dados e aplique seu filtro às suas solicitações de recomendação. Você não precisa atualizar nenhum recomendador nem criar ou atualizar nenhum recurso personalizado.

Substituição do esquema de um conjunto de dados (console)

Para substituir o esquema de um conjunto de dados pelo console do Amazon Personalize, escolha o conjunto de dados a ser modificado e escolha substituí-lo por um novo esquema ou use um existente.

Para substituir um esquema do conjunto de dados
  1. Abra o console do Amazon Personalize em https://console.aws.amazon.com/personalize/home e faça login na sua conta.

  2. Na página Grupos de conjuntos de dados, escolha seu grupo de conjuntos de dados.

  3. No painel de navegação, escolha Conjuntos de dados e escolha o botão de opção para o conjunto de dados que você deseja modificar.

  4. Escolha Ações e Substituir esquema.

  5. Em Detalhes do esquema, escolha substituir por um novo esquema ou por um criado anteriormente.

  6. Especifique o novo esquema a ser usado. Se você optou por:

    • Substituir por um novo esquema, atribua um nome ao esquema e, em Definição do esquema, faça as alterações no esquema JSON.

    • Usar um esquema criado anteriormente, em Esquema criado anteriormente, selecione o esquema a ser utilizado. Somente os esquemas elegíveis serão listados. Para obter informações sobre requisitos do esquema, consulte Diretrizes e requisitos.

  7. Selecione Replace (Substituir). Quando o conjunto de dados está ativo, você pode começar a importar dados que estejam alinhados com o novo esquema. Para ter mais informações, consulte Etapa 2: preparar e importar dados.

Substituição do esquema de um conjunto de dados (AWS CLI)

Para substituir o esquema de um conjunto de dados pelo AWS CLI, você usa o update-dataset comando, especifica o Amazon Resource Name (ARN) do conjunto de dados a ser atualizado e o ARN do novo esquema a ser usado. Não é possível atualizar o esquema de um conjunto de dados de interações com itens, de interações com ações ou de ações.

O código a seguir mostra como atualizar o esquema de um conjunto de dados com AWS CLI. Para substituir o esquema de um conjunto de dados por um novo, primeiro use o comando create-schema. Em seguida, use o código a seguir para substituir o esquema atual pelo novo. Para obter informações sobre como criar um esquema com o AWS CLI, consulteCriar um conjunto de dados e um esquema (AWS CLI). Para obter informações sobre requisitos do esquema e do conjunto de dados, consulte Esquemas.

aws personalize update-dataset \ --dataset-arn Dataset ARN \ --schema-arn New schema ARN

Quando o conjunto de dados está ativo, você pode começar a importar dados que estejam alinhados com o novo esquema. Para ter mais informações, consulte Etapa 2: preparar e importar dados. Para obter informações sobre a última atualização do conjunto de dados, você pode usar a operação DescribeDataset.

Substituindo o esquema de um conjunto de dados (AWS SDKs)

Para substituir o esquema de um conjunto de dados pelos AWS SDKs, você usa a UpdateDataset operação de API. Especifique o Amazon Resource Name (ARN) do conjunto de dados a ser atualizado e o novo esquema a ser usado. Não é possível atualizar o esquema de um conjunto de dados de interações com itens, de interações com ações ou de ações.

O código a seguir mostra como substituir o esquema de um conjunto de dados pelo SDK for Python (Boto3). Para substituir o esquema de um conjunto de dados por um novo, primeiro use a operação CreateSchema. Em seguida, use o código a seguir para substituir o esquema atual pelo novo. Para obter informações sobre como criar um esquema com os AWS SDKs, consulte. Criação de um conjunto de dados e um esquema (AWS SDKs) Para obter informações sobre requisitos do esquema e do conjunto de dados, consulte Esquemas.

import boto3 personalize = boto3.client('personalize') update_dataset_response = personalize.update_dataset( datasetArn = 'dataset_arn', schemaArn = 'new_schema_arn' ) print(update_dataset_response)

Quando o conjunto de dados está ativo, você pode começar a importar dados que estejam alinhados com o novo esquema. Para ter mais informações, consulte Etapa 2: preparar e importar dados. Para obter informações sobre a última atualização do conjunto de dados, você pode usar a operação DescribeDataset.