Testeo - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Testeo

Pregunta

Ejemplo de respuesta

¿Cuáles son los requisitos de las pruebas (por ejemplo, pruebas unitarias, pruebas de integración, end-to-end pruebas)?

Pruebas unitarias para componentes individuales, pruebas de integración con sistemas externos, end-to-end pruebas para escenarios críticos, etc.

¿Cómo se garantiza la calidad y la coherencia de los datos en las diferentes fuentes para la formación generativa en IA?

Mantenemos la calidad de los datos mediante herramientas automatizadas de creación de perfiles de datos, auditorías de datos periódicas y un catálogo de datos centralizado. Hemos implementado políticas de gobierno de datos para garantizar la coherencia entre las fuentes y mantener el linaje de datos.

¿Cómo se evaluará y validará el modelo de IA generativa?

Mediante el uso de un conjunto de datos de reserva, una evaluación humana, pruebas A/B, etc.

¿Cuáles son los criterios para evaluar el rendimiento y la precisión del modelo de IA generativa?

Precisión, memoria, puntuación de F1, perplejidad, evaluación humana, etc.

¿Cómo se identificarán y gestionarán los casos extremos y los casos extremos?

Mediante el uso de un conjunto de pruebas completo, evaluación humana, pruebas contradictorias, etc.

¿Cómo probará los posibles sesgos en el modelo de IA generativa?

Mediante el uso de análisis de paridad demográfica, pruebas de igualdad de oportunidades, técnicas de eliminación de sesgos contradictorios, pruebas contrafácticas, etc.

¿Qué métricas se utilizarán para medir la imparcialidad de los resultados del modelo?

Coeficiente de impacto dispar, cuotas igualadas, paridad demográfica, métricas de equidad individual, etc.

¿Cómo garantizará una representación diversa en los conjuntos de datos de sus pruebas para la detección de sesgos?

Mediante el uso de un muestreo estratificado para todos los grupos demográficos, la colaboración con expertos en diversidad, el uso de datos sintéticos para subsanar las carencias, etc.

¿Qué proceso se implementará para el monitoreo continuo de la imparcialidad del modelo después del despliegue?

Auditorías de imparcialidad periódicas, sistemas automatizados de detección de sesgos, análisis de los comentarios de los usuarios, reentrenamiento periódico con conjuntos de datos actualizados, etc.

¿Cómo abordará los sesgos interseccionales en el modelo de IA generativa?

Mediante el análisis de equidad interseccional, las pruebas de subgrupos, la colaboración con expertos en el campo de la interseccionalidad, etc.

¿Cómo probará el rendimiento del modelo en diferentes idiomas y contextos culturales?

Mediante el uso de conjuntos de pruebas multilingües, la colaboración con expertos culturales, métricas de equidad localizadas, estudios comparativos interculturales, etc.