Formulación del problema - Amazon Machine Learning

Ya no actualizamos el servicio Amazon Machine Learning ni aceptamos nuevos usuarios para él. Esta documentación está disponible para los usuarios actuales, pero ya no la actualizamos. Para obtener más información, consulte Qué es Amazon Machine Learning.

Formulación del problema

El primer paso para el aprendizaje automático consiste en decidir qué desea predecir, que se conoce como la etiqueta o respuesta de destino. Imagine una situación en la que desea fabricar productos, pero la decisión de fabricación de cada producto depende de su número de ventas potenciales. En este caso, es recomendable predecir cuántas veces cada producto se comprará (predecir el número de ventas). Existen varias maneras de definir este problema mediante la utilización del aprendizaje automático. Elegir cómo definir el problema depende de su caso de uso o necesidad empresarial.

¿Desea predecir el número de compras que clientes realizarán para cada producto (en cuyo caso, el destino es numérico y se está resolviendo un problema de regresión)? O bien, ¿quiere predecir qué productos obtendrán más de 10 compras (en cuyo caso, el destino es binario y está resolviendo un problema de clasificación binaria)?

Es importante evitar complicar excesivamente el problema y enmarcar la solución más sencilla que satisfaga sus necesidades. Sin embargo, también es importante evitar la pérdida de información, especialmente información en las respuestas históricas. Aquí, al convertir un número real de ventas en una variable binaria de tipo "más de 10" en lugar de "menos", se perdería información valiosa. Al dedicar tiempo en decidir qué destino tiene el mayor sentido predecir, evitará la creación de modelos que no responden a su pregunta.