Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Preparación e importación de datos con Amazon SageMaker Data Wrangler
importante
Al utilizar Data Wrangler, SageMaker incurrirá en costes. Para obtener una lista completa de los costes y precios, consulte la pestaña Data Wrangler de Amazon SageMaker
Tras crear un grupo de conjuntos de datos, puede utilizar Amazon SageMaker Data Wrangler (Data Wrangler) para importar datos de más de 40 fuentes a un conjunto de datos de Amazon Personalize. Data Wrangler es una función de Amazon SageMaker Studio que proporciona una solución integral para importar, preparar, transformar y analizar datos.
Cuando usa Data Wrangler para preparar e importar datos, utiliza un flujo de datos. Un flujo de datos define una serie de pasos de preparación de datos mediante aprendizaje automático, empezando por la importación de datos. Cada vez que añades un paso a tu flujo, Data Wrangler realiza una acción sobre tus datos, como transformarlos o generar una visualización.
Los siguientes son algunos de los pasos que puede añadir a su flujo para preparar los datos para Amazon Personalize:
-
Estadísticas: puedes añadir pasos de información específicos de Amazon Personalize a tu flujo. Esta información puede ayudarlo a conocer sus datos y las medidas que puede tomar para mejorarlos.
-
Visualizaciones: puede añadir pasos de visualización para generar gráficos, como histogramas y diagramas de dispersión. Los gráficos pueden ayudarle a descubrir problemas en los datos, como valores atípicos o valores faltantes.
-
Transformaciones: puede utilizar los pasos de transformación específicos y generales de Amazon Personalize para asegurarse de que sus datos cumplen con los requisitos de Amazon Personalize. La transformación de Amazon Personalize le ayuda a asignar las columnas de datos a las columnas obligatorias en función del tipo de conjunto de datos de Amazon Personalize.
Si necesita salir de Data Wrangler antes de importar datos a Amazon Personalize, puede volver a donde lo dejó eligiendo el mismo tipo de conjunto de datos al iniciar Data Wrangler desde la consola de Amazon Personalize. O puedes acceder a Data Wrangler directamente a través SageMaker de Studio.
Le recomendamos importar datos de Data Wrangler a Amazon Personalize de la siguiente manera. Los pasos de transformación, visualización y análisis son opcionales, repetibles y se pueden completar en cualquier orden.
-
Configure los permisos: configure los permisos para Amazon Personalize y las funciones SageMaker de servicio. Y configura los permisos para tus usuarios.
-
Inicie Data Wrangler desde la consola Amazon Personalize: utilice la consola Amazon Personalize para configurar un SageMaker dominio e iniciar Data Wrangler.
-
Importe sus datos a Data Wrangler: importe datos de más de 40 fuentes a Data Wrangler. Las fuentes incluyen AWS servicios, como Amazon Redshift, Amazon EMR o Amazon Athena, y terceros, como Snowflake o. DataBricks
-
Transforme sus datos: utilice Data Wrangler para transformar sus datos y cumplir con los requisitos de Amazon Personalize.
-
Visualice y analice sus datos: utilice Data Wrangler para visualizar sus datos y analizarlos mediante información específica de Amazon Personalize.
-
Procese e importe datos a Amazon Personalize: utilice un cuaderno de SageMaker Studio Jupyter para importar los datos procesados a Amazon Personalize.
Información adicional
Los siguientes recursos proporcionan información adicional sobre el uso de Amazon SageMaker Data Wrangler y Amazon Personalize.
-
Para ver un tutorial que explica cómo procesar y transformar un conjunto de datos de muestra, consulte la demostración: Tutorial del conjunto de datos Titanic de Data Wrangler en la Guía para desarrolladores de Amazon. SageMaker Este tutorial presenta los campos y las funciones de Data Wrangler.
-
Para obtener información sobre la incorporación a SageMaker dominios de Amazon, consulte Incorporar a un SageMaker dominio de Amazon mediante la configuración rápida en la Guía para SageMaker desarrolladores de Amazon.
-
Para obtener información sobre los requisitos de datos de Amazon Personalize, consulte Pautas de formato de datos yEsquemas.