Evaluación generativa de la carga de trabajo de IA - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Evaluación generativa de la carga de trabajo de IA

Tabby Ward y Deepak Dixit, Amazon Web Services ()AWS

Noviembre de 2024 (historial del documento)

La evaluación de la carga de trabajo de IA generativa es un método estratégico destinado a evaluar y mejorar la preparación de una organización para crear o actualizar sus cargas de trabajo de IA generativa. Esta evaluación es importante porque la incorporación de la IA generativa en las operaciones empresariales puede cambiar considerablemente el funcionamiento de las cosas y proporcionar nuevas eficiencias y capacidades. Sin embargo, para adoptar la IA generativa con éxito, es esencial comprender a fondo los sistemas actuales y tener un plan claro para el futuro.

Las cargas de trabajo de la IA generativa se refieren a las tareas computacionales que implican el uso de modelos de inteligencia artificial que pueden crear contenido nuevo, como texto, imágenes, código u otros tipos de datos. Estas cargas de trabajo suelen requerir una potencia informática considerable, hardware especializado y grandes conjuntos de datos para el entrenamiento y la inferencia. GPUs La integración de las cargas de trabajo generativas de IA en las operaciones presenta varios desafíos:

  • Requisitos de infraestructura: aprovisionar los importantes recursos computacionales y el hardware especializado que requieren los modelos de IA generativa.

  • Gestión de datos: garantizar la calidad, la privacidad y el cumplimiento de los datos al gestionar grandes conjuntos de datos.

  • Falta de habilidades: falta de experiencia en tecnologías de IA y despliegue de modelos.

  • Consideraciones éticas: abordar los prejuicios, la imparcialidad y la transparencia en el contenido generado por la IA.

  • Complejidad de la integración: incorpora sin problemas la IA generativa a los flujos de trabajo existentes y a los sistemas heredados.

  • Gestión de costes: equilibrar los beneficios potenciales con los altos costes de implementación y operación.

Superar estos desafíos requiere una planificación cuidadosa, una inversión en infraestructura y talento, y un enfoque estratégico de la implementación.

Propósito de esta guía

La IA generativa se está convirtiendo rápidamente en un componente fundamental en muchos sectores. Ofrece oportunidades transformadoras, pero también plantea desafíos en términos de integración, cumplimiento y escalabilidad. Muchas organizaciones tienen dificultades para aprovechar al máximo la IA debido a la debilidad de la base tecnológica, la resistencia al cambio y los problemas de calidad de los datos. La evaluación generativa de la carga de trabajo de la IA aborda estos desafíos al identificar los requisitos de modernización, definir el alcance de la implementación y cuestionar los sistemas y el pensamiento heredados. También ayuda a determinar los productos mínimos viables (MVPs) y le ayuda a desarrollar una arquitectura de solución específica, lo que garantiza un enfoque estructurado y estratégico para la adopción de la IA.

Esta guía sirve como un enfoque estructurado para ayudar a las organizaciones a sortear las complejidades de la adopción de tecnologías de IA generativa. En lugar de definir claramente los requisitos desde el principio, la guía ayuda a:

  • Identificar posibles casos de uso de la IA generativa en su organización.

  • Evaluar la preparación de su organización para la adopción de la IA generativa.

  • Definir y refinar los objetivos de los casos de uso y los objetivos ambiciosos.

  • Determinar el alcance y los requisitos de la implementación de la IA generativa.

  • Desarrollar una arquitectura de solución objetivo.

Público objetivo y beneficios

Esta evaluación está diseñada específicamente para arquitectos de soluciones, arquitectos empresariales y arquitectos de aplicaciones que desean evaluar los aspectos técnicos de la modernización generativa de las cargas de trabajo de IA. También es útil para los gerentes de programas y personal que desean evaluar la preparación general de su equipo, la asignación de recursos y los requisitos de habilitación. Las mejores prácticas del sector hacen hincapié en la importancia de una evaluación exhaustiva para garantizar que estén preparados para la adopción de la IA. Esto incluye evaluar la arquitectura, el almacenamiento, el cumplimiento, la integración, las pruebas, el despliegue y la automatización.

Alcance

El método de evaluación generativa de la carga de trabajo de la IA incluye los siguientes temas:

  • Tecnologías y modelos actuales de IA generativa (por ejemplo, modelos de lenguaje de gran tamaño, modelos de generación de imágenes)

  • Aplicaciones de IA restringidas que utilizan técnicas generativas

  • Integración de la IA generativa con los sistemas y flujos de trabajo existentes

  • Estrategias de datos para entrenar y ajustar los modelos de IA generativa

  • Consideraciones éticas y prácticas de IA responsables para las aplicaciones actuales de IA generativa

  • Estrategias de prueba e implementación de la IA generativa en entornos de producción

  • Consideraciones de seguridad y privacidad para las implementaciones de IA generativa

  • Optimización del rendimiento y escalabilidad de las cargas de trabajo de IA generativa

  • Casos de uso y aplicaciones de la IA generativa en varios sectores

  • Evaluación de los resultados de la IA generativa y de los procesos de control de calidad

Los siguientes temas están fuera del ámbito de aplicación:

  • Escenarios de inteligencia artificial general (AGI) y superinteligencia artificial (ASI)

  • Los avances especulativos del futuro en la IA van más allá de los modelos generativos actuales

  • Aplicaciones de computación cuántica en IA

  • Computación neuromórfica e interfaces cerebro-ordenador

  • Conciencia y autoconciencia en los sistemas de IA

  • Los impactos sociales a largo plazo de la IA avanzada van más allá de las aplicaciones generativas actuales de la IA

  • Marcos regulatorios para hipotéticas tecnologías de IA del futuro

  • Debates filosóficos sobre la naturaleza de la inteligencia y la conciencia en las máquinas

  • Casos extremos o casos de uso de la IA altamente especulativos

  • Especificaciones técnicas detalladas de modelos o arquitecturas de IA patentados