Avaliação generativa da carga de trabalho de IA - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Avaliação generativa da carga de trabalho de IA

Tabby Ward e Deepak Dixit, da Amazon Web Services ()AWS

Novembro de 2024 (histórico do documento)

A avaliação generativa da carga de trabalho de IA é um método estratégico que visa avaliar e melhorar a preparação de uma organização para criar ou atualizar suas cargas de trabalho generativas de IA. Essa avaliação é importante porque a incorporação da IA generativa às operações comerciais pode mudar muito a forma como as coisas funcionam e fornecer novas eficiências e capacidades. No entanto, para adotar a IA generativa com sucesso, é essencial entender completamente os sistemas atuais e ter um plano claro para o futuro.

As cargas de trabalho generativas de IA se referem a tarefas computacionais que envolvem o uso de modelos de inteligência artificial que podem criar novos conteúdos, como texto, imagens, código ou outros tipos de dados. Essas cargas de trabalho normalmente exigem poder computacional substancial, hardware especializado, como GPUs, e grandes conjuntos de dados para treinamento e inferência. A integração de cargas de trabalho generativas de IA às operações apresenta vários desafios:

  • Requisitos de infraestrutura: provisionamento dos recursos computacionais significativos e do hardware especializado que os modelos generativos de IA exigem.

  • Gerenciamento de dados: Garantindo a qualidade, a privacidade e a conformidade dos dados ao lidar com grandes conjuntos de dados.

  • Lacuna de habilidades: falta de experiência em tecnologias de IA e implantação de modelos.

  • Considerações éticas: lidar com preconceitos, justiça e transparência no conteúdo gerado por IA.

  • Complexidade de integração: incorporação perfeita da IA generativa aos fluxos de trabalho existentes e aos sistemas legados.

  • Gerenciamento de custos: equilibrar os benefícios potenciais com os altos custos de implementação e operação.

Superar esses desafios requer um planejamento cuidadoso, investimento em infraestrutura e talento e uma abordagem estratégica para a implementação.

Objetivo deste guia

A IA generativa está rapidamente se tornando um componente essencial em muitos setores. Ela oferece oportunidades transformadoras, mas também apresenta desafios em termos de integração, conformidade e escalabilidade. Muitas organizações lutam para aproveitar totalmente a IA devido a bases tecnológicas fracas, resistência a mudanças e problemas de qualidade de dados. A avaliação generativa da carga de trabalho de IA aborda esses desafios identificando os requisitos de modernização, definindo o escopo da implementação e desafiando sistemas e pensamentos legados. Também ajuda a determinar produtos mínimos viáveis (MVPs) e ajuda a desenvolver uma arquitetura de solução alvo, garantindo uma abordagem estruturada e estratégica para a adoção da IA.

Este guia serve como uma abordagem estruturada para ajudar as organizações a lidar com as complexidades da adoção de tecnologias generativas de IA. Em vez de definir claramente os requisitos desde o início, o guia ajuda a:

  • Identificar possíveis casos de uso da IA generativa em sua organização.

  • Avaliando a prontidão da sua organização para a adoção generativa da IA.

  • Definir e refinar metas de casos de uso e metas ampliadas.

  • Determinar o escopo e os requisitos para a implementação generativa da IA.

  • Desenvolvendo uma arquitetura de solução alvo.

Público-alvo e benefícios

Essa avaliação foi projetada especificamente para arquitetos de soluções, arquitetos corporativos e arquitetos de aplicativos que desejam avaliar os aspectos técnicos da modernização generativa da carga de trabalho de IA. Também é valioso para gerentes de programas e pessoas que desejam avaliar a prontidão geral, a alocação de recursos e os requisitos de capacitação de sua equipe. As melhores práticas do setor enfatizam a importância de uma avaliação abrangente para garantir a prontidão para a adoção da IA. Isso inclui avaliar a arquitetura, o armazenamento, a conformidade, a integração, os testes, a implantação e a automação.

Escopo

Os tópicos a seguir estão no escopo do método generativo de avaliação da carga de trabalho da IA:

  • Tecnologias e modelos atuais de IA generativa (por exemplo, modelos de linguagem grande, modelos de geração de imagens)

  • Aplicativos restritos de IA que usam técnicas generativas

  • Integração da IA generativa com sistemas e fluxos de trabalho existentes

  • Estratégias de dados para treinar e ajustar modelos generativos de IA

  • Considerações éticas e práticas responsáveis de IA para aplicativos atuais de IA generativa

  • Estratégias de teste e implantação para IA generativa em ambientes de produção

  • Considerações sobre segurança e privacidade para implementações generativas de IA

  • Otimização de desempenho e escalabilidade de cargas de trabalho generativas de IA

  • Casos de uso e aplicações da IA generativa em vários setores

  • Avaliação de resultados generativos de IA e processos de garantia de qualidade

Os tópicos a seguir estão fora do escopo:

  • Cenários de inteligência artificial geral (AGI) e superinteligência artificial (ASI)

  • Futuros avanços especulativos em IA além dos modelos generativos atuais

  • Aplicativos de computação quântica em IA

  • Computação neuromórfica e interfaces cérebro-computador

  • Consciência e autoconsciência em sistemas de IA

  • Impactos sociais de longo prazo da IA avançada além das atuais aplicações generativas de IA

  • Estruturas regulatórias para tecnologias hipotéticas de IA do futuro

  • Debates filosóficos sobre a natureza da inteligência e da consciência nas máquinas

  • Casos extremos ou casos de uso altamente especulativos de IA

  • Especificações técnicas detalhadas de modelos ou arquiteturas de IA proprietários