Creazione di un set di dati e di uno schema - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un set di dati e di uno schema

Dopo aver completatoPassaggio 1: creazione di un gruppo di set di dati, sei pronto per creare un set di dati. I set di dati sono contenitori Amazon Personalize per i dati. Quando crei un set di dati, crei anche uno schema per il set di dati. Uno schema indica ad Amazon Personalize la struttura dei dati e consente ad Amazon Personalize di analizzare i dati.

Puoi creare set di dati con la console Amazon Personalize AWS Command Line Interface ,AWS CLI() o gli SDK. AWS Non puoi creare le prossime risorse d'azione migliori, inclusi i set di dati Actions e Action Interactions, in un gruppo di set di dati di dominio. Per informazioni sui diversi tipi di set di dati e sui requisiti dei set di dati e dello schema, consulta. Set di dati e schemi

Creazione di un set di dati e di uno schema (console)

Se questo è il primo set di dati nel gruppo di set di dati, il primo tipo di set di dati sarà un set di dati sulle interazioni tra elementi. Per creare il set di dati sulle interazioni degli elementi nella console, specifica il nome del set di dati e quindi specifica uno schema JSON in formato Avro. Se non è il primo set di dati in questo gruppo di set di dati, scegli il tipo di set di dati e quindi specifica un nome e uno schema.

Per informazioni sui set di dati e sui requisiti dello schema di Amazon Personalize, consulta. Set di dati e schemi

Nota

Se hai appena completato Passaggio 1: creazione di un gruppo di set di dati e stai già creando il set di dati, vai al passaggio 4 di questa procedura.

Per creare un set di dati e uno schema
  1. Apri la console Amazon Personalize all'indirizzo https://console.aws.amazon.com/personalize/home e accedi al tuo account.

  2. Nella pagina dei gruppi di set di dati, scegli il gruppo di set di dati in cui hai creato. Passaggio 1: creazione di un gruppo di set di dati

  3. In Configura set di dati scegli Crea set di dati e scegli il tipo di set di dati da creare.

  4. Scegli Importa i dati direttamente nei set di dati di Amazon Personalize e scegli Avanti.

  5. Nei dettagli del set di dati, per Nome del set di dati, specifica un nome per il set di dati.

  6. Nei dettagli dello schema, per la selezione dello schema, scegli uno schema esistente o scegli Crea nuovo schema.

  7. Se stai creando un nuovo schema, per Definizione dello schema, incolla lo schema JSON che corrisponde ai tuoi dati. Usa gli esempi che trovi in Schemi come guida. Dopo aver creato uno schema, non è possibile apportare modifiche allo schema.

  8. Per New schema name (Nuovo nome schema), specificare un nome per il nuovo schema.

  9. Per i tag, aggiungi facoltativamente qualsiasi tag. Per ulteriori informazioni sull'etichettatura delle risorse Amazon Personalize, consulta. Etichettare le risorse di Amazon Personalize

  10. Scegli Avanti e segui le istruzioni Preparazione e importazione di dati in blocco per importare i dati.

Creazione di un set di dati e di uno schema ()AWS CLI

Per creare un set di dati e uno schema utilizzando il AWS CLI, devi prima definire uno schema in formato Avro e aggiungerlo ad Amazon Personalize utilizzando l'operazione. CreateSchema Quindi crea un set di dati utilizzando l'operazione. CreateDataset Per informazioni sui set di dati e sui requisiti dello schema di Amazon Personalize, consulta. Set di dati e schemi

Per creare uno schema e un set di dati
  1. Crea un file di schema in formato Avro e salvalo come file JSON. Questo file deve essere basato sul tipo di set di dati, ad esempio Interazioni, che stai creando.

    Lo schema deve corrispondere alle colonne dei dati e lo schema name deve corrispondere a uno dei tipi di set di dati riconosciuti da Amazon Personalize. Di seguito è riportato un esempio di schema di set di dati minimo per le interazioni tra oggetti. Per ulteriori esempi, consulta Schemi.

    { "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
  2. Crea uno schema in Amazon Personalize eseguendo il seguente comando. Dopo aver creato uno schema, non puoi apportare modifiche allo schema. Sostituisci schemaName con il nome dello schema e sostituiscilo file://SchemaName.json con la posizione del file JSON creato nel passaggio precedente. L'esempio illustra il file come appartenente alla cartella corrente.

    Se state creando uno schema per un set di dati in un gruppo di set di dati Domain, aggiungete il domain parametro e impostatelo su o. ECOMMERCE VIDEO_ON_DEMAND Per ulteriori informazioni sull'API, consulta CreateSchema.

    aws personalize create-schema \ --name SchemaName \ --schema file://SchemaName.json

    Viene visualizzato lo schema Amazon Resource Name (ARN), come illustrato nell'esempio seguente:

    { "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
  3. Creare un gruppo di set di dati vuoto eseguendo il seguente comando. Fornisci il gruppo di set di dati Amazon Resource Name (ARN) Creazione di un gruppo di set di dati ()AWS CLI e lo schema ARN del passaggio precedente. I valori del tipo di set di dati possono essereInteractions,,Users, Items o. Actions Action_Interactions Per ulteriori informazioni sull'API, consulta CreateDataset.

    aws personalize create-dataset \ --name Dataset Name \ --dataset-group-arn Dataset Group ARN \ --dataset-type Dataset Type \ --schema-arn Schema Arn

    Viene visualizzato il set di dati ARN, come illustrato nell'esempio seguente.

    { "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
  4. Registra l'ARN del set di dati per un uso successivo. Dopo aver creato un set di dati, sei pronto per importare i dati di allenamento. Per informazioni, consulta Preparazione e importazione di dati in blocco.

Creazione di un set di dati e di uno schema (SDK)AWS

Per creare un set di dati e uno schema utilizzando gli AWS SDK, devi prima definire uno schema in formato Avro e aggiungerlo ad Amazon Personalize utilizzando l'operazione. CreateSchema Dopo aver creato uno schema, non puoi apportare modifiche allo schema. Quindi crea un set di dati utilizzando l'CreateDatasetoperazione. Per informazioni sui set di dati e sui requisiti dello schema di Amazon Personalize, consulta. Set di dati e schemi

Per creare uno schema e un set di dati
  1. Crea un file di schema in formato Avro e salvalo come file JSON nella tua directory di lavoro.

    Lo schema deve corrispondere alle colonne dei dati e lo schema name deve corrispondere a un tipo di set di dati riconosciuto da Amazon Personalize. Di seguito è riportato un esempio di schema di set di dati minimo per le interazioni tra oggetti. Per ulteriori esempi, consulta Schemi.

    { "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
  2. Crea uno schema con il codice seguente. Specificate il nome dello schema e il percorso del file JSON dello schema.

    Se state creando uno schema per un set di dati in un gruppo di set di dati di dominio, aggiungete il domain parametro e impostatelo su o. ECOMMERCE VIDEO_ON_DEMAND Per ulteriori informazioni sull'API, consulta CreateSchema.

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') with open('schemaFile.json') as f: createSchemaResponse = personalize.create_schema( name = 'schema name', schema = f.read() ) schema_arn = createSchemaResponse['schemaArn'] print('Schema ARN:' + schema_arn )
    SDK for Java 2.x
    public static String createSchema(PersonalizeClient personalizeClient, String schemaName, String filePath) { String schema = null; try { schema = new String(Files.readAllBytes(Paths.get(filePath))); } catch (IOException e) { System.out.println(e.getMessage()); } try { CreateSchemaRequest createSchemaRequest = CreateSchemaRequest.builder() .name(schemaName) .schema(schema) .build(); String schemaArn = personalizeClient.createSchema(createSchemaRequest).schemaArn(); System.out.println("Schema arn: " + schemaArn); return schemaArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateSchemaCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); import fs from 'fs'; let schemaFilePath = "SCHEMA_PATH"; let mySchema = ""; try { mySchema = fs.readFileSync(schemaFilePath).toString(); } catch (err) { mySchema = 'TEST' // For unit tests. } // Set the schema parameters. export const createSchemaParam = { name: 'NAME', /* required */ schema: mySchema /* required */ }; export const run = async () => { try { const response = await personalizeClient.send(new CreateSchemaCommand(createSchemaParam)); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();

    Amazon Personalize restituisce l'ARN del nuovo schema. Registralo perché ti servirà nel passaggio successivo.

  3. Crea un set di dati utilizzando l'CreateDatasetoperazione. Il codice seguente mostra come creare un set di dati. Specificate l'Amazon Resource Name (ARN) del gruppo di set di dati, lo schema ARN del passaggio precedente e specificate il tipo di set di dati. I valori del tipo di set di dati possono essereInteractions,,, oUsers. Items Actions Action_Interactions Per informazioni sui diversi tipi di set di dati, vedere. Set di dati e schemi

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') response = personalize.create_dataset( name = 'dataset_name', schemaArn = 'schema_arn', datasetGroupArn = 'dataset_group_arn', datasetType = 'dataset_type' ) print ('Dataset Arn: ' + response['datasetArn'])
    SDK for Java 2.x
    public static String createDataset(PersonalizeClient personalizeClient, String datasetName, String datasetGroupArn, String datasetType, String schemaArn) { try { CreateDatasetRequest request = CreateDatasetRequest.builder() .name(datasetName) .datasetGroupArn(datasetGroupArn) .datasetType(datasetType) .schemaArn(schemaArn).build(); String datasetArn = personalizeClient.createDataset(request).datasetArn(); System.out.println("Dataset " + datasetName + " created. Dataset ARN: " + datasetArn); return datasetArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateDatasetCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); // Set the dataset's parameters. export const createDatasetParam = { datasetGroupArn: 'DATASET_GROUP_ARN', /* required */ datasetType: 'DATASET_TYPE', /* required */ name: 'NAME', /* required */ schemaArn: 'SCHEMA_ARN' /* required */ } export const run = async () => { try { const response = await personalizeClient.send(new CreateDatasetCommand(createDatasetParam)); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();

    Dopo aver creato un set di dati, sei pronto per importare i dati di allenamento. Per informazioni, consulta Preparazione e importazione di dati in blocco.