Einen Datensatz und ein Schema erstellen - Amazon Personalize

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einen Datensatz und ein Schema erstellen

Nachdem Sie den Vorgang abgeschlossen habenSchritt 1: Erstellen einer Datensatzgruppe, können Sie einen Datensatz erstellen. Datensätze sind Amazon Personalize Personalize-Container für Daten. Wenn Sie einen Datensatz erstellen, erstellen Sie auch ein Schema für den Datensatz. Ein Schema informiert Amazon Personalize über die Struktur Ihrer Daten und ermöglicht Amazon Personalize, die Daten zu analysieren.

Sie erstellen Datensätze mit der Amazon Personalize Personalize-Konsole, AWS Command Line Interface (AWS CLI) oder AWS SDKs. Sie können in einer Domain-Datensatzgruppe keine Ressourcen für die nächste beste Aktion, einschließlich der Datensätze „Aktionen“ und „Aktionsinteraktionen“, erstellen. Informationen zu den verschiedenen Arten von Datensätzen sowie zu den Anforderungen an Datensätze und Schemas finden Sie unter. Datensätze und Schemas

Einen Datensatz und ein Schema erstellen (Konsole)

Wenn dies Ihr erster Datensatz in Ihrer Datensatzgruppe ist, ist Ihr erster Datensatztyp ein Datensatz mit Artikelinteraktionen. Um Ihren Datensatz mit Artikelinteraktionen in der Konsole zu erstellen, geben Sie den Datensatznamen und anschließend ein JSON-Schema im Avro-Format an. Wenn es nicht Ihr erster Datensatz in dieser Datensatzgruppe ist, wählen Sie den Datensatztyp und geben Sie dann einen Namen und ein Schema an.

Informationen zu Amazon Personalize Personalize-Datensätzen und Schemaanforderungen finden Sie unter. Datensätze und Schemas

Anmerkung

Wenn Sie den Vorgang gerade abgeschlossen haben Schritt 1: Erstellen einer Datensatzgruppe und bereits dabei sind, Ihren Datensatz zu erstellen, fahren Sie mit Schritt 4 dieses Verfahrens fort.

Um einen Datensatz und ein Schema zu erstellen
  1. Öffnen Sie die Amazon Personalize Personalize-Konsole unter https://console.aws.amazon.com/personalize/home und melden Sie sich bei Ihrem Konto an.

  2. Wählen Sie auf der Seite Datensatzgruppen die Datensatzgruppe aus, in Schritt 1: Erstellen einer Datensatzgruppe der Sie sie erstellt haben.

  3. Wählen Sie unter Datensätze einrichten die Option Datensatz erstellen und wählen Sie den Typ des zu erstellenden Datensatzes aus.

  4. Wählen Sie Daten direkt in Amazon Personalize Personalize-Datensätze importieren und dann Weiter.

  5. Geben Sie unter Datensatzdetails für Datensatzname einen Namen für Ihren Datensatz an.

  6. Wählen Sie unter Schemadetails für Schemaauswahl entweder ein vorhandenes Schema aus, oder wählen Sie Neues Schema erstellen aus.

  7. Wenn Sie ein neues Schema erstellen, fügen Sie unter Schemadefinition das Schema-JSON ein, das Ihren Daten entspricht. Verwenden Sie die Beispiele unter Schemata als Leitfaden. Nachdem Sie ein Schema erstellt haben, können Sie keine Änderungen am Schema vornehmen.

  8. Geben Sie für New schema name (Name des neuen Schemas) einen Namen für das neue Schema an.

  9. Fügen Sie für Tags optional beliebige Tags hinzu. Weitere Informationen zum Taggen von Amazon Personalize Personalize-Ressourcen finden Sie unter. Markieren von Amazon-Personalize-Ressourcen

  10. Wählen Sie Weiter und folgen Sie den Anweisungen unter, um Ihre Massendaten vorbereiten und importieren Daten zu importieren.

Einen Datensatz und ein Schema erstellen (AWS CLI)

Um einen Datensatz und ein Schema mit dem zu erstellen AWS CLI, definieren Sie zunächst ein Schema im Avro-Format und fügen es mithilfe der CreateSchema Operation zu Amazon Personalize hinzu. Erstellen Sie dann mithilfe der CreateDataset Operation einen Datensatz. Informationen zu Amazon Personalize Personalize-Datensätzen und Schemaanforderungen finden Sie unter. Datensätze und Schemas

So erstellen Sie ein Schema und einen Datensatz
  1. Erstellen Sie eine Schemadatei im Avro-Format und speichern Sie sie als JSON-Datei. Diese Datei sollte auf dem Datasettyp basieren, den Sie erstellen, z. B. Interaktionen.

    Das Schema muss mit den Spalten in Ihren Daten übereinstimmen und das Schema name muss mit einem der von Amazon Personalize erkannten Datensatztypen übereinstimmen. Das Folgende ist ein Beispiel für ein minimales Datensatzschema für Artikelinteraktionen. Weitere Beispiele finden Sie unter Schemata.

    { "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
  2. Erstellen Sie ein Schema in Amazon Personalize, indem Sie den folgenden Befehl ausführen. Nachdem Sie ein Schema erstellt haben, können Sie keine Änderungen am Schema vornehmen. schemaNameErsetzen Sie es durch den Namen des Schemas und file://SchemaName.json ersetzen Sie es durch den Speicherort der JSON-Datei, die Sie im vorherigen Schritt erstellt haben. Das Beispiel zeigt die Datei als Teil des aktuellen Ordners.

    Wenn Sie ein Schema für einen Datensatz in einer Domain-Datensatzgruppe erstellen, fügen Sie den domain Parameter hinzu und setzen Sie ihn auf ECOMMERCE oderVIDEO_ON_DEMAND. Weitere Informationen zur API finden Sie unter CreateSchema.

    aws personalize create-schema \ --name SchemaName \ --schema file://SchemaName.json

    Das Schema Amazon Resource Name (ARN) wird angezeigt, wie im folgenden Beispiel gezeigt:

    { "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
  3. Erstellen Sie ein leeres Dataset, indem Sie den folgenden Befehl ausführen. Geben Sie die Datensatzgruppe Amazon Resource Name (ARN) von Eine Datensatzgruppe erstellen (AWS CLI) und den Schema-ARN aus dem vorherigen Schritt an. Die Werte für den Datensatztyp können InteractionsUsers,Items,Actions, oder seinAction_Interactions. Weitere Informationen zur API finden Sie unter CreateDataset.

    aws personalize create-dataset \ --name Dataset Name \ --dataset-group-arn Dataset Group ARN \ --dataset-type Dataset Type \ --schema-arn Schema Arn

    Der Dataset-ARN wird angezeigt, wie im folgenden Beispiel gezeigt.

    { "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
  4. Notieren Sie den ARN des Datensatzes für die spätere Verwendung. Nachdem Sie einen Datensatz erstellt haben, können Sie Ihre Trainingsdaten importieren. Siehe Massendaten vorbereiten und importieren.

Einen Datensatz und ein Schema (AWS SDKs) erstellen

Um einen Datensatz und ein Schema mithilfe der AWS SDKs zu erstellen, definieren Sie zunächst ein Schema im Avro-Format und fügen es mithilfe der Operation zu Amazon Personalize hinzu. CreateSchema Nachdem Sie ein Schema erstellt haben, können Sie keine Änderungen am Schema vornehmen. Erstellen Sie dann mithilfe der CreateDataset Operation einen Datensatz. Informationen zu Amazon Personalize Personalize-Datensätzen und Schemaanforderungen finden Sie unter. Datensätze und Schemas

So erstellen Sie ein Schema und einen Datensatz
  1. Erstellen Sie eine Schemadatei im Avro-Format und speichern Sie sie als JSON-Datei in Ihrem Arbeitsverzeichnis.

    Das Schema muss mit den Spalten in Ihren Daten übereinstimmen und das Schema name muss einem von Amazon Personalize erkannten Datasetyp entsprechen. Das Folgende ist ein Beispiel für ein minimales Datensatzschema für Artikelinteraktionen. Weitere Beispiele finden Sie unter Schemata.

    { "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
  2. Erstellen Sie ein Schema mit dem folgenden Code. Geben Sie den Namen für Ihr Schema und den Dateipfad für Ihre Schema-JSON-Datei an.

    Wenn Sie ein Schema für einen Datensatz in einer Domain-Dataset-Gruppe erstellen, fügen Sie den domain Parameter hinzu und setzen Sie ihn auf ECOMMERCE oderVIDEO_ON_DEMAND. Weitere Informationen zur API finden Sie unter CreateSchema.

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') with open('schemaFile.json') as f: createSchemaResponse = personalize.create_schema( name = 'schema name', schema = f.read() ) schema_arn = createSchemaResponse['schemaArn'] print('Schema ARN:' + schema_arn )
    SDK for Java 2.x
    public static String createSchema(PersonalizeClient personalizeClient, String schemaName, String filePath) { String schema = null; try { schema = new String(Files.readAllBytes(Paths.get(filePath))); } catch (IOException e) { System.out.println(e.getMessage()); } try { CreateSchemaRequest createSchemaRequest = CreateSchemaRequest.builder() .name(schemaName) .schema(schema) .build(); String schemaArn = personalizeClient.createSchema(createSchemaRequest).schemaArn(); System.out.println("Schema arn: " + schemaArn); return schemaArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateSchemaCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); import fs from 'fs'; let schemaFilePath = "SCHEMA_PATH"; let mySchema = ""; try { mySchema = fs.readFileSync(schemaFilePath).toString(); } catch (err) { mySchema = 'TEST' // For unit tests. } // Set the schema parameters. export const createSchemaParam = { name: 'NAME', /* required */ schema: mySchema /* required */ }; export const run = async () => { try { const response = await personalizeClient.send(new CreateSchemaCommand(createSchemaParam)); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();

    Amazon Personalize gibt den ARN des neuen Schemas zurück. Notieren Sie es, weil Sie es im nächsten Schritt benötigen werden.

  3. Erstellen Sie mithilfe der CreateDataset Operation einen Datensatz. Der folgende Code zeigt, wie ein Datensatz erstellt wird. Geben Sie den Amazon-Ressourcennamen (ARN) Ihrer Datensatzgruppe, den Schema-ARN aus dem vorherigen Schritt und den Datensatztyp an. Die Werte für den Datensatztyp können InteractionsUsers,Items,Actions, oder seinAction_Interactions. Hinweise zu den verschiedenen Typen von Datensätzen finden Sie unterDatensätze und Schemas.

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') response = personalize.create_dataset( name = 'dataset_name', schemaArn = 'schema_arn', datasetGroupArn = 'dataset_group_arn', datasetType = 'dataset_type' ) print ('Dataset Arn: ' + response['datasetArn'])
    SDK for Java 2.x
    public static String createDataset(PersonalizeClient personalizeClient, String datasetName, String datasetGroupArn, String datasetType, String schemaArn) { try { CreateDatasetRequest request = CreateDatasetRequest.builder() .name(datasetName) .datasetGroupArn(datasetGroupArn) .datasetType(datasetType) .schemaArn(schemaArn).build(); String datasetArn = personalizeClient.createDataset(request).datasetArn(); System.out.println("Dataset " + datasetName + " created. Dataset ARN: " + datasetArn); return datasetArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateDatasetCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); // Set the dataset's parameters. export const createDatasetParam = { datasetGroupArn: 'DATASET_GROUP_ARN', /* required */ datasetType: 'DATASET_TYPE', /* required */ name: 'NAME', /* required */ schemaArn: 'SCHEMA_ARN' /* required */ } export const run = async () => { try { const response = await personalizeClient.send(new CreateDatasetCommand(createDatasetParam)); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();

    Nachdem Sie einen Datensatz erstellt haben, können Sie Ihre Trainingsdaten importieren. Siehe Massendaten vorbereiten und importieren.