Funcionamiento de las máquinas de factorización

La tarea de predicción para un modelo de máquinas de factorización es calcular una función ŷ desde un conjunto de características x_i a un dominio de destino. Este dominio es de valor real para la regresión y binario para la clasificación. El modelo de máquinas de factorización se supervisa, por lo que tiene un conjunto de datos de entrenamiento (x_i,y_j) disponible. Las ventajas de este modelo están en la forma en que utiliza una parametrización factorizada para capturar las interacciones de características por par. Puede representarse matemáticamente tal y como se indica a continuación:

Una imagen que contiene la ecuación para el modelo de máquinas de factorización.

Los tres términos en esta ecuación corresponden, respectivamente, a los tres componentes del modelo:

El término w₀ representa el sesgo global.
Los plazos lineales w_i modelan la intensidad de la variable número i.
Los plazos de factorización <v_i,v_j> modelan la interacción de par entre las variables número i y j.

Los plazos lineales y de sesgo globales son los mismos que en el modelo lineal. Las interacciones de características por pares se modelan en el tercer plazo como el producto interno de los factores correspondientes aprendidos para cada característica. Los factores aprendidos pueden considerarse también vectores de integración para cada característica. Por ejemplo, en una tarea de clasificación, si un par de características suele darse con más frecuencia en muestras etiquetadas positivas, el producto interno de sus factores debería ser grande. Es decir, los vectores de integración deberían estar próximos en la similaridad de coseno. Para obtener más información sobre el modelo de máquinas de factorización, consulte Factorization Machines.

Para las tareas de regresión, se realiza el entrenamiento del modelo minimizando el error cuadrático entre la predicción del modelo ŷ_n y el valor de destino y_n. Esto se denomina la pérdida cuadrada:

Una imagen que contiene la ecuación para pérdida cuadrada.

Para una tarea de clasificación, el modelo se capacita minimizando la pérdida de entropía cruzada, conocida también como pérdida de registro:

Una imagen que contiene la ecuación para pérdida de registro.

donde:

Una imagen que contiene la función logística de los valores previstos.

Para obtener más información acerca de funciones de pérdida para la clasificación, consulte la página sobre funciones de pérdida para clasificación.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Máquinas de factorización

Hiperparámetros