Creación de un modelo de ML - Amazon Machine Learning

Ya no actualizamos el servicio Amazon Machine Learning ni aceptamos nuevos usuarios para él. Esta documentación está disponible para los usuarios actuales, pero ya no la actualizamos. Para obtener más información, consulte Qué es Amazon Machine Learning.

Creación de un modelo de ML

Una vez que haya creado una fuente de datos, está listo para crear un modelo de ML. Si utiliza la consola de Amazon Machine Learning para crear un modelo, puede optar por utilizar la configuración predeterminada o personalizar el modelo mediante la aplicación de opciones personalizadas.

Entre las opciones personalizadas se incluyen:

  • Configuración de la evaluación: puede hacer que Amazon ML reserve una parte de los datos de entrada para evaluar la calidad de predicción del modelo de ML. Para obtener información sobre evaluaciones, consulte la sección Evaluación de modelos de ML.

  • Receta: una receta indica a Amazon ML qué atributos y transformaciones de atributo están disponibles para el entrenamiento de modelos. Para obtener más información sobre las recetas de Amazon ML, consulte Transformaciones de características con recetas de datos.

  • Parámetros de entrenamiento: los parámetros controlan determinadas propiedades del proceso de entrenamiento y del modelo de ML resultante. Para obtener más información sobre los parámetros de entrenamiento, consulte Parámetros de entrenamiento.

Para seleccionar o especificar valores para estos ajustes, elija la opción Custom (Personalizado) cuando utilice el asistente de creación de modelos de ML. Si desea que Amazon ML aplique la configuración predeterminada, elija Predeterminado.

Al crear un modelo de ML, Amazon ML selecciona el tipo de algoritmo de aprendizaje que se utilizará en función del tipo de atributo del atributo de destino. (El atributo de destino es el atributo que contiene las respuestas "correctas".) Si el atributo de destino es "Binario", Amazon ML crea un modelo de clasificación binaria que utiliza el algoritmo de regresión logístico. Si el atributo de destino es "Categórico", Amazon ML crea un modelo multiclase que utiliza un algoritmo de regresión logístico multinomial. Si el atributo de destino es "Numérico", Amazon ML crea un modelo de regresión que utiliza un algoritmo de regresión lineal.

Requisitos previos

Antes de utilizar la consola de Amazon ML para crear un modelo de ML, debe crear dos fuentes de datos, una para entrenar el modelo y otra para evaluarlo. Si no ha creado dos fuentes de datos, consulte Paso 2: cree una fuente de datos de entrenamiento en el tutorial.

Creación de un modelo de ML con las opciones predeterminadas

Elija las opciones Predeterminado si desea que Amazon ML:

  • Divida los datos de entrada para utilizar el primer 70% para el entrenamiento y el 30% restante la evaluación

  • Sugiera una receta en función de las estadísticas recopiladas en la fuente de datos de entrenamiento, que es el 70% de la fuente de datos de entrada

  • Elección de los parámetros de entrenamiento predeterminados

Elección de las opciones predeterminadas
  1. En la consola de Amazon ML, elija Amazon Machine Learning y, a continuación, elija los modelos de machine learning.

  2. En la página de resumen ML models (Modelos ML), elija Create a new ML model (Crear un nuevo modelo de ML).

  3. En la página Input data (Datos de entrada), asegúrese de que está seleccionado I already created a datasource pointing to my S3 data (Siempre he creado un origen de datos que apunta a mis datos de S3).

  4. En la tabla, elija el origen de datos y, a continuación, elija Continue (Continuar).

  5. En la página ML model settings (Configuración de modelo de ML), en ML model name (Nombre de modelo de ML), escriba un nombre para su modelo de ML.

  6. Para Training and evaluation settings (Configuración de entrenamiento y evaluación), asegúrese de que se selecciona Default (Predeterminado).

  7. En Asignar nombre a esta evaluación, escriba un nombre para la evaluación y después elija Revisar. Amazon ML ignora el resto del asistente y le lleva a la página Revisar.

  8. Revise los datos, elimine las etiquetas copiadas del origen de datos que no desea aplicar a su modelo y evaluaciones y, a continuación, elija Finish (Finalizar).

Creación de un modelo de ML con opciones personalizadas

Personalizar su modelo de ML le permite:

  • Proporcionar su propia receta. Para obtener más información sobre cómo proporcionar su propia receta, consulte Recipe Format Reference (Referencia de formato de receta).

  • Elija los parámetros de entrenamiento. Para obtener más información sobre los parámetros de entrenamiento, consulte Parámetros de entrenamiento.

  • Elija una relación de la división de entrenamiento y evaluación distinta de la proporción 70/30 predeterminada o proporcione otra fuente de datos que ya haya preparado para su evaluación. Para obtener información sobre las estrategias de división, consulte División de datos.

También puede elegir los valores predeterminados para cualquiera de estos ajustes.

Si ya se ha creado un modelo utilizando las opciones predeterminadas y desea mejorar el rendimiento predictivo de su modelo, utilice la opción Custom (Personalizado) para crear un modelo nuevo con algunos ajustes personalizados. Por ejemplo, puede agregar más transformaciones de funciones a la receta o aumentar el número de iteraciones en el parámetro de entrenamiento.

Creación de un modelo con opciones personalizadas
  1. En la consola de Amazon ML, elija Amazon Machine Learning y, a continuación, elija los modelos de machine learning.

  2. En la página de resumen ML models (Modelos ML), elija Create a new ML model (Crear un nuevo modelo de ML).

  3. Si ya ha creado un origen de datos, en la página Input data (Datos de entrada), elija I already created a datasource pointing to my S3 data (Ya he creado un origen de datos que apunta a mis datos de S3). En la tabla, elija el origen de datos y, a continuación, elija Continue (Continuar).

    Si necesita crear un origen de datos, elija My data is in S3, and I need to create a datasource (Mis datos están en S3 y necesito crear un origen de datos) y seleccione Continue (Continuar). Se le redirigirá al asistente Create a Datasource (Crear un origen de datos). Especifique si sus datos están en S3 o en Redshift y, a continuación, seleccione Verify (Verificar). Complete el procedimiento para la creación de una fuente de datos.

    Después de crear un origen de datos, se le redirigirá el siguiente paso en el asistente Create ML Model (Crear modelo de ML).

  4. En la página ML model settings (Configuración de modelo de ML), en ML model name (Nombre de modelo de ML), escriba un nombre para su modelo de ML.

  5. En Select training and evaluation settings (Seleccionar configuración de entrenamiento y evaluación), seleccione Custom (Personalizado) y, a continuación, elija Continue (Continuar).

  6. En la página Recipe (Receta) puede customize a recipe. Si no desea personalizar una receta, Amazon ML le sugiere una. Elija Continue (Continuar).

  7. En la página Advanced settings (Configuración avanzada), especifique los valores de Maximum ML model Size (Tamaño de modelo de ML máximo), Maximum number of data passes (Número máximo de pasadas de datos), Shuffle type for training data (Tipo de mezcla para datos de entrenamiento), Regularization type (Tipo de regularización) y Regularization amount (Cantidad de regularización). Si no los especifica, Amazon ML utiliza los parámetros de entrenamiento predeterminados.

    Para obtener más información sobre estos parámetros y sus opciones predeterminadas, consulte Parámetros de entrenamiento.

    Elija Continue (Continuar).

  8. En la página Evaluation (Evaluación), especifique si desea evaluar el modelo de ML inmediatamente. Si no desea evaluar el modelo de ML ahora, seleccione Review (Revisar).

    Si desea evaluar el modelo de ML ahora:

    1. En Name this evaluation (Asignar nombre a esta evaluación), escriba un nombre para la evaluación.

    2. En Seleccionar datos de evaluación, elija si desea que Amazon ML reserve una parte de los datos de entrada para la evaluación y, si lo hace, cómo desea dividir el origen de datos o si decide proporcionar un origen de datos diferente para la evaluación.

    3. Elija Review.

  9. En la página Review (Revisar), edite las selecciones, elimine las etiquetas copiadas del origen de datos que no desea aplicar a su modelo y evaluaciones y, a continuación, elija Finish (Finalizar).

Una vez que haya creado el modelo, consulte Paso 4: Revisar el desempeño predictivo del modelo de ML y establecer un umbral de puntuación.