Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Explorar, analizar y procesar datos
Antes de usar un conjunto de datos para entrenar un modelo, los científicos de datos normalmente lo exploran y lo preprocesan.
Amazon SageMaker Processing permite ejecutar trabajos para preprocesar y posprocesar datos, realizar ingeniería de características y evaluar modelos SageMaker con facilidad y a escala. Cuando se combina con las demás tareas fundamentales de aprendizaje automático que proporciona SageMaker, como la formación y el alojamiento, Processing le ofrece las ventajas de un entorno de aprendizaje automático totalmente gestionado, que incluye todo el soporte de seguridad y cumplimiento integrado. SageMaker Con Processing, tiene la flexibilidad de utilizar los contenedores de procesamiento de datos integrados o de traer sus propios contenedores y enviar tareas personalizadas para que se ejecuten en una infraestructura gestionada. Después de enviar un trabajo, SageMaker lanza las instancias de cómputo, procesa y analiza los datos de entrada y libera los recursos una vez finalizados. Para obtener más información, consulte Procesamiento de datos.
-
Para obtener información sobre cómo ejecutar sus propios scripts de procesamiento de datos, consulteProcesamiento de características con scikit-learn.
-
Para obtener información acerca de cómo crear su propio contenedor de procesamiento para ejecutar scripts, consulte Crear su propio contenedor de procesamiento (escenario avanzado).
-
Para obtener información sobre cómo realizar un análisis exploratorio de datos (EDA) con una interfaz visual sin código, consulte. Prepare datos de aprendizaje automático con Amazon SageMaker Data Wrangler