Observabilidad de IA generativa

Con Amazon CloudWatch, puede observar las cargas de trabajo de IA generativa, tales como agentes de Amazon Bedrock AgentCore, y obtener información sobre el rendimiento, el estado y la precisión de la IA. CloudWatch proporciona vistas preconfiguradas de la latencia, el uso y los errores de sus cargas de trabajo de IA, lo que le permite detectar problemas más rápidamente en componentes como modelos y agentes. El seguimiento de peticiones de principio a fin es útil para identificar rápidamente los problemas en componentes como las bases de conocimiento, las herramientas y los modelos. Las funcionalidades de monitoreo de IA de CloudWatch son compatibles con los marcos de orquestación de IA generativa populares como AWSStrands, LangChain y LangGraph, lo que ofrece flexibilidad para elegir el marco.

La observabilidad de IA generativa de CloudWatch le permite:

Obtener información sobre los resultados de los usuarios finales, el rendimiento, el estado y la precisión de la IA y, al mismo tiempo, reducir la carga de las evaluaciones con intervención humana (HITL)
Monitorear las invocaciones de los modelos, los agentes (gestionados, autoalojados y de terceros), las bases de conocimiento, las barreras de protección y las herramientas
Avanzar a partir de la experimentación con agentes hasta la producción de aplicaciones innovadoras de IAGen, lo que garantiza también una calidad, un rendimiento y una fiabilidad superiores. Para más información, consulte ¿Qué es Amazon Bedrock AgentCore?
Identificar rápidamente el origen de los errores mediante el rastreo de peticiones de principio a fin, las métricas seleccionadas y los registros
Solucionar problemas en toda la aplicación de IAGen y la infraestructura subyacente mediante el uso de las herramientas de observabilidad de CloudWatch existentes, como Application Signals, Alarms, Dashboards, Sensitive data protection y Logs Insights
Acceder a los seguimientos de peticiones mientras utiliza Amazon Bedrock y envíe seguimientos estructurados de modelos de terceros a CloudWatch mediante el SDK de ADOT. Para obtener información sobre cómo agregar observabilidad a su agente o herramienta de Amazon Bedrock AgentCore, consulte Amazon Bedrock AgentCore

La observabilidad de la IA generativa de CloudWatch ofrece dos paneles prediseñados:

nota

Debe activar Amazon Bedrock para ver el panel invocación de modelos.

Invocaciones de modelos: métricas detalladas sobre el uso del modelo, el consumo de tokens y los costos
Agentes de Amazon Bedrock AgentCore: métricas de rendimiento y decisión para los agentes de Amazon Bedrock

Las métricas clave disponibles en estos paneles incluyen:

Invocaciones totales y promedio
Uso de tokens (total, promedio por consulta, entrada, salida)
Latencia (promedio, P90, P99)
Tasas de error y eventos de limitación
Atribución de costos por aplicación, rol de usuario o usuario específico

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Tutorial: A/B testing with the Evidently sample application (Pruebas A/B con la aplicación de muestra de Evidently)

Invocaciones de modelos