Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Generación de visualizaciones y análisis de datos
Después de importar sus datos en Data Wrangler, puede usarlos para generar visualizaciones y análisis de datos
-
Visualizaciones: Data Wrangler puede generar diferentes tipos de gráficos, como histogramas y gráficos de dispersión. Por ejemplo, puede generar un histograma para identificar valores atípicos en sus datos.
-
Análisis de datos: puede utilizar un Informe de información y calidad de los datos para Amazon Personalize para obtener información sobre sus datos a través de la información de datos y las estadísticas de columnas y filas. Este informe puede indicarle si tiene problemas de tipos con sus datos. Además, puede saber qué medidas puede tomar para mejorar sus datos. Estas acciones pueden ayudarlo a cumplir con los requisitos de recursos de Amazon Personalize, como los requisitos de entrenamiento de modelos, o pueden mejorar las recomendaciones.
Una vez que conozca sus datos a través de visualizaciones e información, podrá utilizar esta información como ayuda para aplicar transformaciones adicionales a fin de mejorar sus datos. O bien, si ha terminado de preparar sus datos, puede procesarlos e importarlos en Amazon Personalize. Para obtener información sobre las transformaciones de datos, consulte Transformación de datos. Para obtener información sobre el procesamiento y la importación de datos, consulte Procesamiento de los datos y su importación en Amazon Personalize.
Generación de visualizaciones
Puede usar Data Wrangler para crear diferentes tipos de gráficos, como histogramas y gráficos de dispersión. Por ejemplo, puede generar un histograma para identificar valores atípicos en sus datos. Para generar una visualización de datos, añada un paso de Análisis al flujo y, en Tipo de análisis, elija la visualización que desee crear.
Para obtener más información sobre la creación de visualizaciones en Data Wrangler, consulte Analyze and Visualize en la Guía para desarrolladores de Amazon SageMaker .
Generación de análisis de datos
Puede usar Data Wrangler para generar un Informe de información y calidad de datos para Amazon Personalize específico para su tipo de conjunto de datos. Antes de generar el informe, le recomendamos que transforme los datos para cumplir con los requisitos de Amazon Personalize. Esto generará información más relevante. Para obtener más información, consulte Transformación de datos.
Contenido del informe
El Informe de información y calidad de los datos de Amazon Personalize incluye las siguientes secciones:
-
Resumen: el resumen del informe incluye estadísticas del conjunto de datos y advertencias de alta prioridad:
-
Estadísticas de conjuntos de datos: incluyen estadísticas específicas de Amazon Personalize, como el número de usuarios únicos en sus datos de interacciones, y estadísticas generales, como el número de valores atípicos o valores que faltan.
-
Advertencias de alta prioridad: se trata de información específica de Amazon Personalize que tiene el mayor impacto en el entrenamiento o las recomendaciones. Cada advertencia incluye una acción recomendada que puede realizar para resolver el problema.
-
-
Filas duplicadas y filas incompletas: estas secciones incluyen información sobre qué filas tienen valores faltantes y qué filas están duplicadas en sus datos.
-
Resumen de características: en esta sección se incluye el tipo de datos para cada columna, la información de los datos que faltan o no son válidos, y los recuentos de advertencias.
-
Detalles de características: esta sección incluye subsecciones con información detallada para cada una de las columnas de datos. Cada subsección incluye estadísticas para la columna, como el recuento de valores categóricos y la información sobre los valores que faltan. Además, cada subsección incluye información específica de Amazon Personalize y acciones recomendadas para las columnas de datos. Por ejemplo, una información podría indicar que una columna tiene más de 30 categorías posibles.
Problemas de tipos de datos
El informe identifica columnas que no son del tipo de datos correcto y especifica el tipo requerido. Para obtener información relacionada con estas características, debe convertir el tipo de datos de la columna y volver a generar el informe. Para convertir el tipo, puede utilizar la transformación de Data Wrangler Analizar valor como tipo.
Información sobre Amazon Personalize
La información de Amazon Personalize incluyen un resultado y una acción sugerida. La acción es opcional. Por ejemplo, el informe puede incluir información y una acción relacionadas con el número de categorías para una columna de datos categóricos. Si no cree que la columna sea categórica, puede ignorar esta información y no realizar ninguna acción.
Salvo pequeñas diferencias de redacción, la información específica de Amazon Personalize es la misma que la información de un conjunto de datos único que puede generar al analizar sus datos con Amazon Personalize. Por ejemplo, el informe de conclusiones de Data Wrangler incluye información como “El conjunto de datos de interacciones de elementos tiene solo X usuarios únicos con dos o más interacciones”. Sin embargo, no incluye información como “El X % de los elementos del conjunto de datos de elementos no tiene interacciones en el conjunto de datos de interacciones de elementos”.
Para ver una lista de posibles conclusiones específicas de Amazon Personalize, consulte la información que no hace referencia a varios conjuntos de datos en Información sobre los datos.
Ejemplos de informes
El aspecto del informe de Amazon Personalize es el mismo que el del informe de información general de Data Wrangler. Para ver ejemplos del informe de información general, consulte Obtenga información sobre los datos y la calidad de los datos en la Guía para SageMaker desarrolladores de Amazon. En el siguiente ejemplo se muestra cómo funciona la sección de resumen de un informe para un conjunto de datos de interacciones de elementos. Incluye estadísticas de conjuntos de datos y algunas posibles advertencias del conjunto de datos de interacciones de elementos de alta prioridad.
El siguiente ejemplo muestra cómo puede aparecer en un informe la sección de detalles de las funciones de una TYPE columna EVENT _ de un conjunto de datos de interacciones entre elementos.
Generación del informe
Para generar el Informe de información y calidad de los datos para Amazon Personalize, elija Obtener información sobre los datos para su transformación y cree un análisis.
Para generar un Informe de información y calidad de los datos para Amazon Personalize
-
Elija la opción + para la transformación que está analizando. Si no ha agregado ninguna transformación, elija el signo + para la transformación de Tipos de datos. Data Wrangler añade esta transformación automáticamente a su flujo.
-
Elija Obtener información sobre los datos. Aparece el panel Crear análisis.
-
En Tipo de análisis, elija Informe de información y calidad de los datos para Amazon Personalize.
-
En Tipo de conjunto de datos, elija el tipo de conjunto de datos de Amazon Personalize que está analizando.
-
Si lo desea, elija Ejecutar en datos completos. De forma predeterminada, Data Wrangler genera información sobre solo una muestra de sus datos.
-
Seleccione Crear. Cuando se complete el análisis, aparecerá el informe.