Évaluation de la charge de travail générative de - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Évaluation de la charge de travail générative de

Tabby Ward et Deepak Dixit, Amazon Web Services ()AWS

Novembre 2024 (historique du document)

L'évaluation de la charge de travail d'IA générative est une méthode stratégique visant à évaluer et à améliorer le niveau de préparation d'une organisation à créer ou à mettre à jour ses charges de travail d'IA générative. Cette évaluation est importante car l'intégration de l'IA générative dans les opérations commerciales peut modifier considérablement la façon dont les choses fonctionnent et peut apporter de nouvelles performances et capacités. Cependant, pour réussir à adopter l'IA générative, il est essentiel de bien comprendre les systèmes actuels et d'avoir un plan clair pour le futur.

Les charges de travail génératives liées à l'IA font référence à des tâches informatiques impliquant l'utilisation de modèles d'intelligence artificielle capables de créer de nouveaux contenus, tels que du texte, des images, du code ou d'autres types de données. Ces charges de travail nécessitent généralement une puissance de calcul importante, du matériel spécialisé tel que GPUs, et de grands ensembles de données pour la formation et l'inférence. L'intégration des charges de travail génératives liées à l'IA dans les opérations présente plusieurs défis :

  • Exigences en matière d'infrastructure : provisionnement des ressources informatiques importantes et du matériel spécialisé requis par les modèles d'IA générative.

  • Gestion des données : garantir la qualité, la confidentialité et la conformité des données lors de la gestion de grands ensembles de données.

  • Manque de compétences : manque d'expertise dans les technologies d'intelligence artificielle et le déploiement de modèles.

  • Considérations éthiques : remédier aux préjugés, à l'équité et à la transparence dans le contenu généré par l'IA.

  • Complexité de l'intégration : intégration fluide de l'IA générative dans les flux de travail existants et les systèmes existants.

  • Gestion des coûts : équilibre entre les avantages potentiels et les coûts élevés de mise en œuvre et d'exploitation.

Pour surmonter ces défis, il faut une planification minutieuse, des investissements dans les infrastructures et les talents, ainsi qu'une approche stratégique de la mise en œuvre.

Objectif de ce guide

L'IA générative devient rapidement un élément essentiel dans de nombreux secteurs. Elle offre des opportunités de transformation mais pose également des défis en termes d'intégration, de conformité et d'évolutivité. De nombreuses organisations ont du mal à tirer pleinement parti de l'IA en raison de la faiblesse des bases technologiques, de la résistance au changement et des problèmes de qualité des données. L'évaluation de la charge de travail de l'IA générative permet de relever ces défis en identifiant les exigences de modernisation, en définissant le champ de mise en œuvre et en remettant en question les systèmes et les modes de pensée existants. Il aide également à déterminer le minimum de produits viables (MVPs) et vous aide à développer une architecture de solution cible, garantissant ainsi une approche structurée et stratégique de l'adoption de l'IA.

Ce guide constitue une approche structurée pour aider les organisations à faire face aux complexités liées à l'adoption de technologies d'IA générative. Au lieu de définir clairement les exigences dès le départ, le guide aide à :

  • Identifier les cas d'utilisation potentiels de l'IA générative au sein de votre organisation.

  • Évaluer l'état de préparation de votre entreprise à l'adoption de l'IA générative.

  • Définition et affinement des objectifs des cas d'utilisation et des objectifs ambitieux.

  • Déterminer la portée et les exigences de la mise en œuvre de l'IA générative.

  • Développement d'une architecture de solution cible.

Public cible et avantages

Cette évaluation est spécialement conçue pour les architectes de solutions, les architectes d'entreprise et les architectes d'applications qui souhaitent évaluer les aspects techniques de la modernisation de la charge de travail générative de l'IA. Il est également utile pour les responsables des programmes et des personnes qui souhaitent évaluer l'état de préparation global de leur équipe, l'allocation des ressources et les exigences en matière d'habilitation. Les meilleures pratiques du secteur soulignent l'importance d'une évaluation complète pour garantir l'état de préparation à l'adoption de l'IA. Cela inclut l'évaluation de l'architecture, du stockage, de la conformité, de l'intégration, des tests, du déploiement et de l'automatisation.

Portée

Les sujets suivants sont concernés par la méthode d'évaluation de la charge de travail de l'IA générative :

  • Technologies et modèles actuels d'IA générative (par exemple, grands modèles de langage, modèles de génération d'images)

  • Applications d'IA restreintes qui utilisent des techniques génératives

  • Intégration de l'IA générative aux systèmes et flux de travail existants

  • Stratégies de données pour la formation et le réglage précis des modèles d'IA générative

  • Considérations éthiques et pratiques responsables en matière d'IA pour les applications d'IA générative actuelles

  • Stratégies de test et de déploiement pour l'IA générative dans les environnements de production

  • Considérations relatives à la sécurité et à la confidentialité pour les implémentations d'IA générative

  • Optimisation des performances et évolutivité des charges de travail génératives liées à l'IA

  • Cas d'utilisation et applications de l'IA générative dans divers secteurs

  • Évaluation des résultats de l'IA générative et des processus d'assurance qualité

Les sujets suivants sont hors de portée :

  • Scénarios d'intelligence générale artificielle (AGI) et de superintelligence artificielle (ASI)

  • Les futures avancées spéculatives de l'IA au-delà des modèles génératifs actuels

  • Applications de l'informatique quantique dans le domaine de l'IA

  • Informatique neuromorphique et interfaces cerveau-ordinateur

  • Conscience et conscience de soi dans les systèmes d'IA

  • Impacts sociétaux à long terme de l'IA avancée au-delà des applications d'IA générative actuelles

  • Cadres réglementaires pour les futures technologies d'IA hypothétiques

  • Débats philosophiques sur la nature de l'intelligence et de la conscience dans les machines

  • Cas extrêmes ou cas d'utilisation hautement spéculatifs de l'IA

  • Spécifications techniques détaillées des modèles ou architectures d'IA propriétaires