Integrando uma carga de trabalho tradicional na nuvem com o Amazon Bedrock - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Integrando uma carga de trabalho tradicional na nuvem com o Amazon Bedrock

O escopo desse caso de uso é demonstrar uma carga de trabalho de nuvem tradicional integrada ao Amazon Bedrock para aproveitar os recursos de IA generativa. O diagrama a seguir ilustra a conta Generative AI em conjunto com um exemplo de conta de aplicativo. 

Integrando uma carga de trabalho tradicional na nuvem com o Amazon Bedrock

A conta Generative AI é dedicada a fornecer funcionalidade de IA generativa usando o Amazon Bedrock. A conta do aplicativo é um exemplo de carga de trabalho. Os serviços da AWS que você usa nessa conta dependem dos seus requisitos. As interações entre a conta Generative AI e a conta do aplicativo usam as APIs do Amazon Bedrock. 

A conta Application é separada da conta Generative AI para ajudar a agrupar cargas de trabalho com base nos objetivos comerciais e na propriedade. Isso ajuda a restringir o acesso a dados confidenciais no ambiente generativo de IA e oferece suporte à aplicação de controles de segurança distintos por ambiente. Manter a carga de trabalho tradicional da nuvem em uma conta separada também ajuda a limitar o escopo do impacto de eventos adversos

Você pode criar e escalar aplicativos corporativos de IA generativa com base em vários casos de uso que são suportados pelo Amazon Bedrock. Alguns casos de uso comuns são geração de texto, assistência virtual, pesquisa de texto e imagem, resumo de texto e geração de imagens. Dependendo do seu caso de uso, seu componente de aplicativo interage com um ou mais recursos do Amazon Bedrock, como bases de conhecimento e agentes. 

Conta do aplicativo

A conta do aplicativo hospeda a infraestrutura e os serviços principais para executar e manter um aplicativo corporativo. Nesse contexto, a conta Application atua como a carga de trabalho tradicional da nuvem, que interage com o serviço gerenciado Amazon Bedrock na conta Generative AI. Consulte a seção Conta do aplicativo Workload OU para ver as melhores práticas gerais de segurança para proteger essa conta. 

As melhores práticas padrão de segurança de aplicativos se aplicam como em outros aplicativos. Se você planeja usar a geração aumentada de recuperação (RAG), em que o aplicativo consulta informações relevantes de uma base de conhecimento, como um banco de dados vetoriais, usando uma solicitação de texto do usuário, o aplicativo precisa propagar a identidade do usuário para a base de conhecimento, e a base de conhecimento aplica seus controles de acesso baseados em funções ou atributos.

Outro padrão de design para aplicativos generativos de IA é usar agentes para orquestrar interações entre um modelo básico (FM), fontes de dados, bases de conhecimento e aplicativos de software. Os agentes chamam as APIs para realizar ações em nome do usuário que está interagindo com o modelo. O mecanismo mais importante para corrigir isso é garantir que cada agente propague a identidade do usuário do aplicativo para os sistemas com os quais ele interage. Você também deve garantir que cada sistema (fonte de dados, aplicativo etc.) entenda a identidade do usuário, limite suas respostas às ações que o usuário está autorizado a realizar e responda com dados que o usuário está autorizado a acessar.

Também é importante limitar o acesso direto aos pontos finais de inferência do modelo pré-treinado que foram usados para gerar inferências. Você deseja restringir o acesso aos endpoints de inferência para controlar custos e monitorar atividades. Se seus endpoints de inferência estiverem hospedados na AWS, como nos modelos básicos do Amazon Bedrock, você poderá usar o IAM para controlar as permissões para invocar ações de inferência. 

Se seu aplicativo de IA estiver disponível para os usuários como um aplicativo da Web, você deverá proteger sua infraestrutura usando controles como firewalls de aplicativos da Web. Ameaças cibernéticas tradicionais, como injeções de SQL e inundações de solicitações, podem ser possíveis contra seu aplicativo. Como as invocações do seu aplicativo causam invocações das APIs de inferência do modelo, e as chamadas da API de inferência do modelo geralmente são cobradas, é importante reduzir as inundações para minimizar as cobranças inesperadas do seu provedor de FM. Os firewalls de aplicativos da Web não protegem contra ameaças de injeção imediata, porque essas ameaças estão na forma de texto em linguagem natural. Os firewalls combinam código (por exemplo, HTML, SQL ou expressões regulares) em locais onde é inesperado (texto, documentos etc.). Para ajudar a proteger contra ataques imediatos de injeção e garantir a segurança do modelo, use grades de proteção

Registrar e monitorar a inferência em modelos generativos de IA é crucial para manter a segurança e evitar o uso indevido. Ele permite a identificação de possíveis agentes de ameaças, atividades maliciosas ou acesso não autorizado e ajuda a permitir a intervenção e a mitigação oportunas dos riscos associados à implantação desses modelos poderosos.

Conta generativa de IA

Dependendo do caso de uso, a conta de IA generativa hospeda todas as atividades de IA generativa. Isso inclui, mas não está limitado a, invocação de modelo, RAG, agentes e ferramentas e personalização de modelos. Consulte as seções anteriores que discutem casos de uso específicos para ver quais recursos e implementação são necessários para sua carga de trabalho. 

As arquiteturas apresentadas neste guia oferecem uma estrutura abrangente para organizações que usam os serviços da AWS para aproveitar os recursos generativos de IA de forma segura e eficiente. Essas arquiteturas combinam a funcionalidade totalmente gerenciada do Amazon Bedrock com as melhores práticas de segurança para fornecer uma base sólida para integrar a IA generativa às cargas de trabalho e processos organizacionais tradicionais da nuvem. Os casos de uso específicos abordados, incluindo o fornecimento de FMs generativos de IA, RAG, agentes e personalização de modelos, abordam uma ampla variedade de possíveis aplicações e cenários. Essa orientação fornece às organizações a compreensão necessária dos serviços AWS Bedrock e de seus controles de segurança inerentes e configuráveis, permitindo que elas tomem decisões informadas adaptadas à sua infraestrutura, aplicações e requisitos de segurança exclusivos.