Adopción de un enfoque por capas para el desarrollo de la IA generativa - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Adopción de un enfoque por capas para el desarrollo de la IA generativa

Para crear una plataforma de IA generativa sólida y escalable, las organizaciones necesitan un entorno integral que permita la innovación y, al mismo tiempo, mantenga el control y la seguridad. Este documento de estrategia recomienda un entorno preparado para la empresa que consta de cuatro capas esenciales, que se muestran en la siguiente imagen.

Las cuatro capas de un entorno de IA generativa preparado para la empresa.

Cada uno de los siguientes niveles desempeña un papel crucial en el éxito de la adopción y el escalamiento de la IA generativa en toda la empresa:

  1. Infraestructura de datos y computación: una infraestructura confiable proporciona la base para desarrollar, capacitar e implementar aplicaciones de IA generativa. Esta capa garantiza que las organizaciones cuenten con los recursos computacionales y las capacidades de administración de datos necesarios para respaldar diversos casos de uso, desde pequeños experimentos hasta despliegues de producción a gran escala. En el caso de Amazon Elastic Compute Cloud (Amazon EC2), considere la posibilidad de utilizar AWS TrainiumAWS InferentiaUltraClusters,, Elastic Fabric Adapter, Capacity Blocks for ML, AWS Nitro System y AWS Neuron.

  2. Modelos y herramientas básicos aprobados: esta capa permite a su organización acceder a modelos aprobados y previamente entrenados y, al mismo tiempo, mantener la seguridad y el cumplimiento. Los equipos pueden experimentar con diferentes modelos, evaluar su eficacia y seleccionar los más adecuados para casos de uso específicos. Puede usar Amazon Bedrock para establecer barandas, crear agentes, personalizar modelos o importar su propio modelo personalizado.

  3. Seguridad y gobierno: esta capa le ayuda a garantizar que las aplicaciones de IA generativa cumplan con las políticas organizativas, los requisitos de conformidad, los requisitos legales y de privacidad y las directrices éticas. En esta capa, se implementan controles de seguridad y mecanismos de gobierno coherentes en todas las iniciativas de IA generativa.

  4. Patrones de aplicación repetibles: esta capa acelera el desarrollo y promueve la coherencia al proporcionar plantillas estandarizadas y las mejores prácticas para casos de uso comunes de la IA generativa. Proporcionar patrones repetibles ayuda a evitar la duplicación de esfuerzos y permite escalar rápidamente las soluciones exitosas. Algunos ejemplos de patrones repetibles son el procesamiento inteligente de documentos, la generación aumentada de recuperación (RAG), los asistentes basados en el chat y los flujos de trabajo de los agentes.

Este enfoque por capas ofrece las siguientes ventajas clave:

  • Separa claramente los diferentes aspectos de la implementación de la IA generativa.

  • Promueve una seguridad y una gobernanza coherentes en todas las iniciativas de IA generativa.

  • Le ayuda a crear una infraestructura escalable que crece con las necesidades de la organización.

  • Estandariza los enfoques que aceleran el desarrollo.

  • Reduce el riesgo mediante patrones y prácticas comprobados.

Al implementar estos cuatro niveles, las organizaciones pueden crear una base sólida para sus iniciativas generativas de IA y, al mismo tiempo, mantener la flexibilidad necesaria para adaptarse a los nuevos requisitos y oportunidades.