Casos de uso - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Casos de uso

Pergunta

Exemplo de resposta

Qual é a meta principal ou o critério de sucesso do caso de uso?

Para melhorar o tempo de resposta do suporte ao cliente, aumentar as conversões de vendas e aprimorar as recomendações de produtos. Além disso: para melhorar a satisfação do usuário, a taxa de conclusão da tarefa, a qualidade da resposta e assim por diante.

Como esse caso de uso se alinha às metas estratégicas da sua organização?

Isso se alinha ao nosso objetivo estratégico de aumentar a satisfação do cliente reduzindo os tempos de resposta no atendimento ao cliente.

Qual é o volume esperado de dados ou solicitações para o caso de uso?

500 transações por segundo (TPS).

Quais tipos de fontes de dados são necessários para dar suporte às suas cargas de trabalho generativas de IA?

Bancos de dados estruturados internos (registros de clientes, dados de vendas etc.); dados de texto não estruturados de documentos, e-mails e mídias sociais; arquivos de áudio e vídeo para tarefas de reconhecimento de voz e imagem; dados de streaming em tempo real de dispositivos e sensores de IoT; conjuntos APIs de dados públicos e para enriquecimento.

Com que frequência você precisa atualizar ou atualizar os dados dessas fontes?

Bancos de dados transacionais: atualizações quase em tempo real; repositórios de documentos: atualizações diárias em lote; feeds de mídia social: atualizações de hora em hora; dados do sensor de IoT: streaming contínuo em tempo real; conjuntos de dados públicos: atualizações mensais ou trimestrais.

Quais formatos de dados seus modelos generativos de IA exigem como entrada?

Dados estruturados: tabelas de banco de dados CSV, JSON e SQL; dados de texto: texto simples, PDF e HTML; dados de imagem: JPEG, PNG e TIFF; dados de áudio: WAV e; dados de vídeo: e MP3 AVI. MP4

Quais são suas principais preocupações com a qualidade de dados para cargas de trabalho generativas de IA?

Completude: garantia de que nenhum campo crítico esteja ausente; precisão: verificação da exatidão dos dados e eliminação de erros; consistência: manutenção de formatos e valores uniformes em todas as fontes; pontualidade: garantia de que os dados estejam atualizados para inferência em tempo real; relevância: confirmação de que os dados estão alinhados com a tarefa específica de IA generativa.

Quais são os principais requisitos de desempenho (por exemplo, tempo de resposta, produtividade, precisão)?

95% de precisão; tempo de resposta de < 500 ms; capacidade de lidar com 1000 solicitações/segundo. Alta precisão (95% +), precisão moderada (80-90%), melhor esforço e assim por diante.

Você tem algum outro KPIs para medir o sucesso desse caso de uso?

KPIs Os principais incluem redução da taxa de erro, economia de tempo por transação e pontuações de satisfação do cliente.

Quanta precisão do modelo é desejada e como ela se equilibra com o custo?

Alta precisão (> 90%) com custo moderado, precisão moderada (70-80%) com baixo custo e assim por diante.

Quais são os principais casos de uso ou cenários da solução generativa de IA?

Chatbot de atendimento ao cliente, geração de conteúdo, recomendação de produtos e assim por diante.

Quais são os usuários-alvo ou personas do sistema generativo de IA?

Agentes de atendimento ao cliente, equipe de marketing, funcionários, usuários finais e assim por diante.

Qual é o volume esperado de solicitações ou usuários?

1.000 solicitações por dia; 10.000 usuários ativos mensais.

Há alguma restrição ou requisito de caso de uso específico?

Resposta em tempo real, suporte multilíngue, privacidade de dados e assim por diante.

Você tem um orçamento alocado para desenvolver e manter a solução generativa de IA?

O custo inicial de desenvolvimento é estimado em $200.000, com custos anuais de manutenção de $50.000.

Qual é o retorno do investimento (ROI) projetado e o período de retorno para esse caso de uso?

ROI esperado de 150% em três anos, com um período de retorno de 18 meses.

Há algum custo oculto ou economia potencial que deva ser considerada?

As economias potenciais incluem a redução dos custos de horas extras. Os custos ocultos podem envolver treinamento adicional para a equipe.

Quais são as possibilidades de escalabilidade e futura expansão dessa solução generativa de IA?

A solução foi projetada para se expandir com nossas operações, com a possibilidade de expansão para outros departamentos no futuro.

Como você garante a imparcialidade e mitiga o preconceito em seus modelos generativos de IA?

Planejamos mitigar o viés por meio de coleta diversificada de dados, auditorias regulares de preconceito e implementação de técnicas de mitigação de preconceitos.

Quais processos você tem em vigor para lidar com questões éticas ou consequências não intencionais?

Gerenciaremos as preocupações éticas por meio de um plano estabelecido de resposta a incidentes de IA, avaliações regulares de risco ético, um sistema de denúncias anônimas para funcionários, colaboração com especialistas externos em ética e monitoramento e ajuste contínuos dos modelos implantados com base no feedback.

Como você aborda a priorização e o sequenciamento das avaliações generativas da carga de trabalho de IA em diferentes projetos e departamentos da sua organização?

Realizando uma pesquisa de alto nível em todos os departamentos para identificar possíveis casos de uso generativo de IA e avaliá-los com base em três critérios principais: impacto nos negócios, viabilidade técnica e considerações éticas. Projetos com alto impacto potencial, menores barreiras técnicas e preocupações éticas mínimas têm prioridade.