Exemplo: usar o Application Signals para solucionar problemas de aplicações de IA generativa que interagem com modelos do Amazon Bedrock - Amazon CloudWatch

Exemplo: usar o Application Signals para solucionar problemas de aplicações de IA generativa que interagem com modelos do Amazon Bedrock

É possível usar o Application Signals para solucionar problemas de suas aplicações de IA generativa que interagem com modelos do Amazon Bedrock. O Application Signals simplifica esse processo fornecendo dados de telemetria prontos para uso, oferecendo insights mais aprofundados sobre as interações da sua aplicação com os modelos LLM. Ele ajuda a abordar os principais casos de uso, como:

  • Problemas de configuração do modelo

  • Custos de uso do modelo

  • Latência do modelo

  • Motivos da interrupção da geração de respostas do modelo

Habilitar o Application Signals com LLM e observabilidade de IA generativa fornece visibilidade em tempo real das interações da aplicação com os serviços do Amazon Bedrock. O Application Signals gera e correlaciona automaticamente métricas e rastreamentos de performance para chamadas de API do Amazon Bedrock.

O Application Signals atualmente é compatível com os modelos LLM do Amazon Bedrock a seguir.

  • AI21 Jamba

  • Amazon Titan

  • Claude da Anthropic

  • Command da Cohere

  • Llama da Meta

  • Mistral AI

  • Nova

Métricas e rastreamentos detalhados

Para cada chamada de API do Amazon Bedrock, o Application Signals gera métricas de performance detalhadas no nível do recurso, incluindo:

  • ID do modelo

  • ID das barreiras de proteção

  • ID da base de conhecimento

  • ID do agente do Bedrock

Além disso, extensões de rastreamento correlacionadas no mesmo nível ajudam a fornecer uma visão abrangente da execução e das dependências da solicitação.

Métricas de performance usando o Application Signals.

Compatibilidade com os atributos de IA generativa do OpenTelemetry

O Application Signals gera os atributos de IA generativa a seguir para chamadas de API do Amazon Bedrock com a convenção semântica do OpenTelemetry. Esses atributos ajudam a analisar o uso, o custo e a qualidade da resposta do modelo e podem ser aproveitados por meio do Transaction Search para obter insights mais aprofundados.

  • gen_ai.system

  • gen_ai.request.model

  • gen_ai.request.max_tokens

  • gen_ai.request.temperature

  • gen_ai.request.top_p

  • gen_ai.usage.input_tokens

  • gen_ai.usage.output_tokens

  • gen_ai.response.finish_reasons

Atributos de IA generativa usando o Application Signals.

Por exemplo, você pode aproveitar a capacidade analítica do Transaction Search para comparar o uso e o custo de tokens em diferentes modelos LLM para o mesmo prompt, permitindo uma seleção de modelo econômica.

Atributos de IA generativa usando o Application Signals.

Para obter mais informações, consulte Improve Amazon Bedrock Observability with CloudWatch Application Signals.