Pesquisa vetorial - OpenSearch Serviço Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Pesquisa vetorial

A pesquisa vetorial no Amazon OpenSearch Service permite que você pesquise conteúdo semanticamente semelhante usando incorporações de aprendizado de máquina em vez da correspondência tradicional de palavras-chave. A pesquisa vetorial converte seus dados (texto, imagens, áudio etc.) em vetores numéricos de alta dimensão (incorporações) que capturam o significado semântico do conteúdo. Ao realizar uma pesquisa, OpenSearch compara a representação vetorial da sua consulta com os vetores armazenados para encontrar os itens mais semelhantes.

A pesquisa vetorial inclui os seguintes componentes principais.

Campos vetoriais

OpenSearch suporta o tipo de knn_vector campo para armazenar vetores densos com dimensões configuráveis (até 16.000).

Métodos de pesquisa
  • k-NN (k-vizinhos mais próximos): encontra os k vetores mais semelhantes

  • k-NN aproximado: usa algoritmos como o HNSW (Hierarchical Navigable Small World) para pesquisas mais rápidas em grandes conjuntos de dados

Métricas de distância

Suporta vários cálculos de similaridade, incluindo:

  • Distância euclidiana

  • Similaridade de cossenos

  • Produto Dot

Casos de uso comuns

A pesquisa vetorial oferece suporte aos seguintes casos de uso comuns.

  • Pesquisa semântica: encontre documentos com significado semelhante, não apenas palavras-chave correspondentes

  • Sistemas de recomendação: sugira produtos, conteúdos ou usuários semelhantes

  • Pesquisa de imagens: encontre imagens visualmente semelhantes

  • Detecção de anomalias: identifique valores discrepantes nos padrões de dados

  • RAG (Retrieval Augmented Generation): aprimore as respostas do LLM com contexto relevante

Integração com aprendizado de máquina

OpenSearch se integra aos seguintes serviços e modelos de aprendizado de máquina:

  • Amazon Bedrock: para gerar incorporações usando modelos básicos

  • Amazon SageMaker AI: para implantação de modelo de ML personalizado

  • Modelos Hugging Face: modelos de incorporação pré-treinados

  • Modelos personalizados: seus próprios modelos de incorporação treinados

A pesquisa vetorial permite que você crie aplicativos sofisticados baseados em IA que entendem o contexto e o significado, indo muito além dos recursos tradicionais de correspondência de texto.