Creazione di una knowledge base mediante connessione a un’origine dati in Knowledge Base per Amazon Bedrock

Quando crei una knowledge base connettendola a un’origine dati, imposta o specifica quanto segue:

Informazioni generali che definiscono e identificano la knowledge base.
Il ruolo di servizio con autorizzazioni per la knowledge base.
Configurazioni per la knowledge base, incluso il modello di embedding da utilizzare per la conversione dei dati dall’origine dati e le configurazioni di archiviazione per il servizio in cui archiviare gli embedding e, facoltativamente, una ubicazione S3 per l’archiviazione dei dati multimodali.

Nota

Non puoi creare una knowledge base con un utente root. Accedi con un utente IAM prima di iniziare questi passaggi.

Espandi la sezione corrispondente al tuo caso d’uso:

Come configurare una knowledge base

Accedi a Console di gestione AWS con un'identità IAM che dispone delle autorizzazioni per utilizzare la console Amazon Bedrock. Quindi, apri la console Amazon Bedrock in https://console.aws.amazon.com/bedrock.
Nel riquadro di navigazione a sinistra, scegli Knowledge base.
Nella sezione Knowledge base, scegli il pulsante Crea, quindi scegli di creare una knowledge base con un archivio vettoriale.
(Opzionale) Modifica il nome predefinito e fornisci una descrizione per la tua knowledge base.
Scegli un ruolo AWS Identity and Access Management (IAM) che fornisca l'autorizzazione ad Amazon Bedrock per accedere ad altri AWS servizi richiesti. Puoi lasciare che Amazon Bedrock crei il ruolo di servizio oppure puoi scegliere di utilizzare un ruolo personalizzato che hai creato per Analisi Neptune.
Scegli un’origine dati a cui collegare la tua knowledge base.
(Opzionale) Aggiungi tag alla knowledge base. Per ulteriori informazioni, consulta Assegnazione di tag alle risorse Amazon Bedrock.
(Opzionale) Configura i servizi per i quali fornire i log delle attività per la tua knowledge base.
Vai alla sezione successiva e segui i passaggi illustrati in Connettere un’origine dati alla knowledge base per configurare un’origine dati.
Nella sezione Modello di embedding, procedi come segue:
1. Scegli un modello di embedding per convertire i tuoi dati in embedding vettoriali. Per i dati multimodali (immagini, audio e video), seleziona un modello di incorporamento multimodale come Amazon Titan Multimodal Embeddings G1 o Cohere Embed v3.
  
  Nota
  Quando usi Amazon Titan Multimodal Embeddings G1, devi fornire un bucket di contenuti S3 e puoi usare solo il parser predefinito. Questo modello è ottimizzato per i casi d'uso nella ricerca di immagini. Per una guida completa sulla scelta tra approcci multimodali, vedere. Crea una base di conoscenze per contenuti multimodali
2. (Facoltativo) Espandi la sezione Configurazioni aggiuntive per visualizzare le seguenti opzioni di configurazione (non tutti i modelli supportano tutte le configurazioni):
  - Tipo di embedding: scegli se convertire i dati in embedding vettoriali in virgola mobile (float32) (più precisi ma più costosi) o embedding vettoriali binari (meno precisi, ma meno costosi). Per scoprire quali modelli di embedding supportano i vettori binari, consulta la sezione relativa ai modelli di embedding supportati.
  - Dimensioni vettoriali: valori più elevati migliorano l’accuratezza ma aumentano i costi e la latenza.
Nella sezione Database vettoriale, effettua le seguenti operazioni:
1. Scegli un archivio vettoriale per archiviare gli embedding vettoriali che verranno utilizzati per la query. Sono disponibili le seguenti opzioni:
  - Crea rapidamente un nuovo archivio vettoriale: scegli uno degli archivi vettoriali disponibili per Amazon Bedrock da creare. Puoi anche configurare opzionalmente la crittografia a AWS KMS chiave per il tuo archivio vettoriale.
    
    Nota
    Quando utilizzi questa opzione, Amazon Bedrock gestisce automaticamente il posizionamento dei metadati per ogni archivio vettoriale.
    Amazon OpenSearch Serverless — Amazon Bedrock Knowledge Bases crea una raccolta e un indice di ricerca vettoriale Amazon OpenSearch Serverless e la configura con i campi richiesti per te.
    
    Amazon Aurora PostgreSQL Serverless: Amazon Bedrock configura un archivio vettoriale Amazon Aurora PostgreSQL Serverless. Questo processo prende dati di testo non strutturati da un bucket Amazon S3, li trasforma in blocchi di testo e vettori, quindi li archivia in un database PostgreSQL. Per ulteriori informazioni, consulta Creazione rapida di una Knowledge Base per Amazon Bedrock di Aurora PostgreSQL.
    
    Analisi Amazon Neptune: Amazon Bedrock utilizza tecniche di generazione potenziata da recupero dati (RAG) combinate con grafi per migliorare le applicazioni di IA generativa in modo che gli utenti finali possano ottenere risposte più accurate e complete.
    
    Amazon S3 Vectors: Knowledge Base per Amazon Bedrock creano un bucket vettoriale S3 e un indice vettoriale che archivieranno gli embedding generati dalle origini dati.
    
    Puoi creare una knowledge base per Amazon S3 Vectors in tutti gli Regione AWS ambienti in cui sono disponibili sia Amazon Bedrock che Amazon S3 Vectors. Per informazioni sulla disponibilità delle Regioni, consulta Amazon S3 Vectors nella Guida per l’utente di Amazon S3.
    
    Nota
    Quando usi Amazon S3 Vectors con Amazon Bedrock Knowledge Bases, puoi allegare fino a 1 KB di metadati personalizzati (inclusi metadati filtrabili e non filtrabili) e 35 chiavi di metadati per vettore. Per informazioni dettagliate sulle limitazioni dei metadati, consulta in. Supporto per metadati Prerequisiti per l’utilizzo di un archivio vettoriale creato per una knowledge base
  - Scegli un archivio vettoriale che hai creato: seleziona un archivio vettoriale supportato e identifica i nomi dei campi vettoriali e i nomi dei campi di metadati nell’indice vettoriale. Per ulteriori informazioni, consulta Prerequisiti per l’utilizzo di un archivio vettoriale creato per una knowledge base.
    
    Nota
    Se la tua origine dati è un'istanza Confluence SharePoint, Microsoft o Salesforce, l'unico servizio di archiviazione vettoriale supportato è Amazon Serverless. OpenSearch
2. (Opzionale) Espandi la sezione Configurazioni aggiuntive e modifica le configurazioni pertinenti.
Se l’origine dati contiene immagini, specifica un URI Amazon S3 in cui archiviare le immagini che il parser estrarrà dai dati nella destinazione di archiviazione multimodale. Le immagini possono essere restituite durante la query. Opzionalmente, puoi anche scegliere una chiave gestita dal cliente anziché quella predefinita per crittografare i tuoi dati. Chiave gestita da AWS

Nota
I dati multimodali sono supportati solo da Amazon S3 e origini dati personalizzate.
Nota
Quando si utilizzano modelli di incorporamento multimodali:
- Amazon Titan Multimodal Embeddings G1 richiede un bucket di contenuti S3 e funziona al meglio con set di dati di sola immagine utilizzando il parser predefinito
- Cohere Embed v3 supporta set di dati misti di testo e immagini e può essere utilizzato con qualsiasi configurazione del parser
- Per i casi di ricerca di immagini, evita di utilizzare Bedrock Data Automation (BDA) o parser Foundation Model con Titan G1 a causa delle limitazioni dei token
- La destinazione di archiviazione multimodale crea copie di file a scopo di recupero, il che può comportare costi di archiviazione aggiuntivi
Scegli Avanti e rivedi i dettagli della tua knowledge base. Puoi modificare qualsiasi sezione prima di procedere e creare la tua knowledge base.

Nota
Il tempo richiesto per creare la knowledge base dipende dalle configurazioni specifiche. Una volta completata la creazione della knowledge base, lo stato della knowledge base cambia per indicare che è pronta o disponibile.
Una volta che la knowledge base è pronta e disponibile, sincronizza l’origine dati per la prima volta e ogni volta che desideri aggiornare i contenuti. Scegli la knowledge base nella console, poi scegli Sincronizza nella sezione Panoramica dell’origine dati.

Per creare una knowledge base, invia una richiesta CreateKnowledgeBase con un endpoint in fase di compilazione Agent per Amazon Bedrock.

Nota

Se preferisci lasciare che Amazon Bedrock crei e gestisca un archivio vettoriale per tuo conto, utilizza la console. Per ulteriori informazioni, espandi la sezione Utilizzo della console in questo argomento.

I seguenti campi sono obbligatori:

Campo	Descrizione di base
nome	Un nome per la knowledge base
roleArn	L’ARN di un ruolo di servizio di Knowledge Base per Amazon Bedrock.
knowledgeBaseConfiguration	Contiene le configurazioni per la knowledge base. Fai riferimento ai dettagli riportati di seguito.
storageConfiguration	(Richiesto solo se ti connetti a un’origine dati non strutturata). Contiene le configurazioni per il servizio di origine dati scelto.

I seguenti campi sono facoltativi:

Campo	Caso d’uso
description	Una descrizione per la knowledge base.
clientToken	Garantire che la richiesta API venga completata solo una volta. Per ulteriori informazioni, consulta Garanzia di idempotenza.
tag	Associare tag al flusso. Per ulteriori informazioni, consulta Assegnazione di tag alle risorse Amazon Bedrock.

Nel knowledgeBaseConfiguration campo, che corrisponde a un KnowledgeBaseConfigurationoggetto, specificate VECTOR nel campo e includete un oggetto. type VectorKnowledgeBaseConfiguration Nell’oggetto, includi i seguenti campi:

embeddingModelArn: l’ARN del modello di embedding da utilizzare.
embeddingModelConfiguration: le configurazioni per il modello di embedding. Per visualizzare i possibili valori che è possibile specificare per ogni modello supportato, consulta Regioni e modelli supportati per Knowledge Base per Amazon Bedrock.
(Se prevedi di includere dati multimodali, che includono immagini, figure, grafici o tabelle, nella tua knowledge base), esegue il supplementalDataStorageConfiguration mapping su un SupplementalDataStorageLocationoggetto, in cui specifichi la posizione S3 in cui archiviare i dati estratti. Per ulteriori informazioni, consulta Opzioni di analisi per l’origine dati.

Nel storageConfiguration campo, che corrisponde a un StorageConfigurationoggetto, specifica l'archivio vettoriale a cui intendi connetterti nel type campo e includi il campo che corrisponde a quell'archivio vettoriale. Consulta ogni tipo di configurazione dell'archivio vettoriale all'indirizzo StorageConfigurationper i dettagli sulle informazioni che devi fornire.

Di seguito viene illustrato un esempio di richiesta per creare una knowledge base connessa a una raccolta Amazon OpenSearch Serverless. I dati provenienti da fonti di dati connesse verranno convertiti in incorporamenti vettoriali binari con Amazon Titan Text Embeddings V2 e i dati multimodali estratti dal parser sono configurati per essere archiviati in un bucket chiamato. MyBucket


PUT /knowledgebases/ HTTP/1.1
Content-type: application/json

{
   "name": "MyKB",
   "description": "My knowledge base",
   "roleArn": "arn:aws:iam::111122223333:role/service-role/AmazonBedrockExecutionRoleForKnowledgeBase_123",
   "knowledgeBaseConfiguration": {
      "type": "VECTOR",
      "vectorKnowledgeBaseConfiguration": { 
         "embeddingModelArn": "arn:aws:bedrock:us-east-1::foundation-model/amazon.titan-embed-text-v2:0",
         "embeddingModelConfiguration": { 
            "bedrockEmbeddingModelConfiguration": { 
               "dimensions": 1024,
               "embeddingDataType": "BINARY"
            }
         },
         "supplementalDataStorageConfiguration": { 
            "storageLocations": [ 
               { 
                  "s3Location": { 
                     "uri": "arn:aws:s3:::MyBucket"
                  },
                  "type": "S3"
               }
            ]
         }
      }
   },
   "storageConfiguration": { 
      "opensearchServerlessConfiguration": { 
         "collectionArn": "arn:aws:aoss:us-east-1:111122223333:collection/abcdefghij1234567890",
         "fieldMapping": { 
            "metadataField": "metadata",
            "textField": "text",
            "vectorField": "vector"
         },
         "vectorIndexName": "MyVectorIndex"
      }
   }
}

Argomenti

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Configurazione delle autorizzazioni OpenSearch con un controllo granulare degli accessi

Connettere un’origine dati