Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de un conjunto de datos y un esquema
Una vez haya terminado Paso 1: Creación de un grupo de conjunto de datos, estará listo para crear un conjunto de datos. Los conjuntos de datos son contenedores para datos de Amazon Personalize. Cuando crea un conjunto de datos, también crea un esquema para el conjunto de datos. Un esquema informa a Amazon Personalize de la estructura de sus datos y permite que Amazon Personalize analice los datos.
Los conjuntos de datos se crean con la consola Amazon Personalize, AWS Command Line Interface (AWS CLI) o con los AWS SDK. No puede crear los siguientes recursos de mejor acción, incluidos los conjuntos de datos de acciones e interacciones entre acciones, en un grupo de conjuntos de datos de dominio. Para obtener más información sobre los distintos tipos de conjunto de datos, así como los requisitos de conjuntos de datos y esquemas, consulte Conjuntos de datos y esquemas.
Temas
Creación de un conjunto de datos y un esquema (consola)
Si este es el primer conjunto de datos de su grupo de conjuntos de datos, su primer tipo de conjunto de datos será un conjunto de datos de interacciones de elementos. Para crear el conjunto de datos de interacciones de elementos en la consola, especifique el nombre del conjunto de datos y, a continuación, especifique un esquema JSON en formato Avro
Para obtener información sobre los requisitos de esquemas y conjuntos de datos de Amazon Personalize, consulte Conjuntos de datos y esquemas.
nota
Si acaba de completar Paso 1: Creación de un grupo de conjunto de datos y ya está creando el conjunto de datos, vaya al paso 4 de este procedimiento.
Para crear un conjunto de datos y un esquema
-
Abra la consola de Amazon Personalize en https://console.aws.amazon.com/personalize/home
e inicie sesión en su cuenta. -
En la página Grupos de conjuntos de datos, elija el grupo de conjuntos de datos que creó en Paso 1: Creación de un grupo de conjunto de datos.
-
En Configurar conjuntos de datos, elija Crear conjunto de datos y seleccione el tipo de conjunto de datos que quiera crear.
-
Elija Importar datos directamente a los conjuntos de datos de Amazon Personalize y elija Siguiente.
-
En Detalles del conjunto de datos, en Nombre del conjunto de datos, especifique un nombre para el conjunto de datos.
-
En Detalles del esquema, en Selección del esquema, haga clic en Crear nuevo esquema.
-
Si va a crear un esquema nuevo, en Definición del esquema, pegue el JSON del esquema que coincida con sus datos. Utilice los ejemplos que se encuentran en Schemas como guía. Una vez que se haya creado un esquema, no se podrán realizar cambios en él.
-
En Nuevo nombre de esquema, especifique un nombre para el nuevo esquema.
-
Parar Etiquetas, si lo desea, añada cualquier etiqueta. Para obtener más información acerca del etiquetado de recursos de Amazon Personalize, consulte Etiquetado de recursos de Amazon Personalize.
-
Elija Siguiente y siga las instrucciones de Preparación e importación de datos masivos para importar los datos.
Creación de un conjunto de datos y un esquema (AWS CLI)
Para crear un conjunto de datos y un esquema mediante el AWS CLI, primero debe definir un esquema en formato Avro
Para crear un esquema y un conjunto de datos
-
Cree un archivo de esquema en formato Avro y guárdelo como archivo JSON. Este archivo debe basarse en el tipo de conjunto de datos, como las interacciones, que vaya a crear.
El esquema debe coincidir con las columnas de sus datos y el valor
name
del esquema debe coincidir con uno de los tipos de conjuntos de datos reconocidos por Amazon Personalize. A continuación, se muestra un ejemplo de un esquema de conjunto de datos de interacciones de elementos mínimo. Para obtener más ejemplos, consulte Schemas.{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
-
Ejecute el siguiente comando para crear un esquema en Amazon Personalize. Una vez que se haya creado un esquema, no se podrán realizar cambios en él. Reemplace
schemaName
por el nombre del esquema yfile://SchemaName.json
por la ubicación del archivo JSON que ha creado en el paso anterior. En el ejemplo, el archivo pertenece a la carpeta actual.Si va a crear un esquema para un conjunto de datos en un grupo de conjunto de datos de dominio, debe agregar el parámetro
domain
y establecerlo enECOMMERCE
oVIDEO_ON_DEMAND
. Para obtener más información sobre la API, consulte CreateSchema.aws personalize create-schema \ --name
SchemaName
\ --schemafile://SchemaName.json
Se muestra el nombre de recurso de Amazon (ARN) del esquema, como se muestra en el siguiente ejemplo:
{ "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
-
Ejecute el siguiente comando para crear un conjunto de datos vacío. Proporcione el grupo de conjunto de datos del que proviene el nombre de recurso de Amazon (ARN) Creación de un grupo de conjuntos de datos (AWS CLI) y el esquema de ARN del paso anterior. Los valores del tipo de conjunto de datos pueden ser
Interactions
,Users
,Items
,Actions
oAction_Interactions
. Para obtener más información sobre la API, consulte CreateDataset.aws personalize create-dataset \ --name
Dataset Name
\ --dataset-group-arnDataset Group ARN
\ --dataset-typeDataset Type
\ --schema-arnSchema Arn
Se muestra el ARN del conjunto de datos, tal como se muestra en el ejemplo siguiente.
{ "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
-
Registre el ARN del conjunto de datos para su uso posterior. Una vez que haya creado un conjunto de datos, estará listo para importar sus datos de entrenamiento. Consulte Preparación e importación de datos masivos.
Crear un conjunto de datos y un esquema (AWS SDK)
Para crear un conjunto de datos y un esquema con AWS los SDK, primero debe definir un esquema en formato Avro
Para crear un esquema y un conjunto de datos
-
Cree un archivo de esquema en formato Avro y guárdelo como archivo JSON en su directorio de trabajo.
El esquema debe coincidir con las columnas de sus datos y el
name
de esquema debe coincidir con uno de los tipos de conjuntos de datos reconocidos por Amazon Personalize. A continuación, se muestra un ejemplo de un esquema de conjunto de datos de interacciones de elementos mínimo. Para obtener más ejemplos, consulte Schemas.{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }
-
Cree un esquema con el siguiente código. Especifique el nombre de su esquema y la ruta del archivo JSON del esquema.
Si va a crear un esquema para un conjunto de datos en un grupo de conjunto de datos de dominio, debe agregar el parámetro
domain
y establecerlo enECOMMERCE
oVIDEO_ON_DEMAND
. Para obtener más información sobre la API, consulte CreateSchema.Amazon Personalize devuelve el ARN del nuevo esquema. Anote el valor, ya que lo necesitará en el siguiente paso.
-
Cree un conjunto de datos utilizando la operación CreateDataset. El código siguiente muestra cómo crear un conjunto de datos. Especifique el nombre de recurso de Amazon (ARN) de su grupo de conjuntos de datos, el ARN del esquema del paso anterior y especifique el tipo de conjunto de datos. Los valores del tipo de conjunto de datos pueden ser
Interactions
,Users
,Items
,Actions
oAction_Interactions
. Para obtener información sobre los distintos tipos de conjuntos de datos, consulte Conjuntos de datos y esquemas.Una vez que haya creado un conjunto de datos, estará listo para importar sus datos de entrenamiento. Consulte Preparación e importación de datos masivos.