Configura la ricerca neurale e la ricerca ibrida su Serverless OpenSearch - OpenSearch Servizio Amazon

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Configura la ricerca neurale e la ricerca ibrida su Serverless OpenSearch

Ricerca neurale

Amazon OpenSearch Serverless supporta la funzionalità di ricerca neurale per operazioni di ricerca semantica sui tuoi dati. Neural Search utilizza modelli di apprendimento automatico per comprendere il significato semantico e il contesto delle tue query, fornendo risultati di ricerca più pertinenti rispetto alle tradizionali ricerche basate su parole chiave. Questa sezione spiega come configurare Neural Search in OpenSearch Serverless, incluse le autorizzazioni richieste, i processori supportati e le differenze principali rispetto all'implementazione standard. OpenSearch

Con Neural Search puoi eseguire ricerche semantiche sui tuoi dati, che prendono in considerazione il significato semantico per comprendere l'intento delle tue query di ricerca. Questa funzionalità è alimentata dai seguenti componenti:

  • Processore di pipeline di inserimento del testo

  • Interrogazione neurale

  • Interrogazione neurale sparsa

Con la ricerca ibrida, puoi migliorare la pertinenza della ricerca combinando funzionalità di ricerca semantica e parole chiave. Per utilizzare la ricerca ibrida, crea una pipeline di ricerca che elabori i risultati della ricerca e combini i punteggi dei documenti. Per ulteriori informazioni, consulta Search pipeline sul sito Web della OpenSearch documentazione. Utilizzate i seguenti componenti per implementare la ricerca ibrida:

  • Processore di pipeline di ricerca per la normalizzazione

    Tecniche di normalizzazione supportate
    • min_max

    • l2

    Tecniche di combinazione supportate
    • arithmetic_mean

    • geometric_mean

    • harmonic_mean

    Per ulteriori informazioni sulle tecniche di normalizzazione e combinazione, consulta Request body fields sul sito Web della OpenSearchdocumentazione.

  • Query ibrida

Interrogazioni neurali e ibride

Per impostazione predefinita, OpenSearch calcola i punteggi dei documenti utilizzando l' BM25algoritmo Okapi basato su parole chiave, che funziona bene per le query di ricerca che contengono parole chiave. Neural Search offre nuovi tipi di query per le query in linguaggio naturale e la possibilità di combinare la ricerca semantica con quella per parole chiave.

Esempio : neural
"neural": { "vector_field": { "query_text": "query_text", "query_image": "image_binary", "model_id": "model_id", "k": 100 } }

Per ulteriori informazioni, consulta Neural query sul sito Web della documentazione. OpenSearch

Esempio : hybrid
"hybrid": { "queries": [ array of lexical, neural, or combined queries ] }

Per ulteriori informazioni, vedere Hybrid query sul sito Web della OpenSearch documentazione.

Per configurare i componenti di ricerca semantica in Amazon OpenSearch Serverless, segui i passaggi del tutorial Neural Search sul sito Web della OpenSearch documentazione. Tieni a mente queste importanti differenze:

  • OpenSearch Serverless supporta solo modelli remoti. È necessario configurare i connettori per i modelli ospitati in remoto. Non è necessario distribuire o rimuovere modelli remoti. Per ulteriori informazioni, consulta Guida introduttiva alla ricerca semantica e ibrida sul sito Web della OpenSearch documentazione.

  • Aspettati fino a 15 secondi di latenza quando esegui una ricerca nell'indice vettoriale o cerchi pipeline di ricerca e inserimento create di recente.

Configurazione delle autorizzazioni

La ricerca neurale in OpenSearch Serverless richiede le seguenti autorizzazioni. Per ulteriori informazioni, consulta Autorizzazioni delle policy supportate.

Esempio : Politica di ricerca neurale
JSON
{ "Version": "2012-10-17", "Statement": [ { "Sid": "NeuralSearch", "Effect": "Allow", "Action": [ "aoss:CreateIndex", "aoss:CreateCollectionItems", "aoss:CreateMLResource", "aoss:DescribeCollectionItems", "aoss:UpdateCollectionItems", "aoss:DeleteIndex", "aoss:DeleteCollectionItems", "aoss:DeleteMLResource", "aoss:APIAccessAll", ], "Resource": "*" } ] }
  • aoss: *Index — Crea un indice vettoriale in cui vengono memorizzati gli incorporamenti di testo.

  • aoss: * CollectionItems — Crea pipeline di importazione e ricerca.

  • aoss: * MLResource — Crea e registra modelli di incorporamento del testo.

  • aoss: APIAccess All — Fornisce l'accesso a OpenSearch APIs per le operazioni di ricerca e inserimento.

Di seguito vengono descritte le politiche di accesso ai dati di raccolta necessarie per la ricerca neurale. Sostituiscili placeholder values con le tue informazioni specifiche.

Esempio : politica di accesso ai dati
[ { "Description": "Create index permission", "Rules": [ { "ResourceType": "index", "Resource": ["index/collection_name/*"], "Permission": [ "aoss:CreateIndex", "aoss:DescribeIndex", "aoss:UpdateIndex", "aoss:DeleteIndex" ] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, { "Description": "Create pipeline permission", "Rules": [ { "ResourceType": "collection", "Resource": ["collection/collection_name"], "Permission": [ "aoss:CreateCollectionItems", "aoss:DescribeCollectionItems", "aoss:UpdateCollectionItems", "aoss:DeleteCollectionItems" ] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, { "Description": "Create model permission", "Rules": [ { "ResourceType": "model", "Resource": ["model/collection_name/*"], "Permission": ["aoss:CreateMLResources"] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] } ]