Creazione di una knowledge base - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di una knowledge base

Nota

Non è possibile creare una knowledge base con un utente root. Accedi con un utente IAM prima di iniziare questi passaggi.

Dopo aver configurato l'origine dati in Amazon S3 e un archivio vettoriale a tua scelta, puoi creare una knowledge base. Seleziona la scheda corrispondente al metodo che preferisci e segui i passaggi.

Console
Per creare una knowledge base
  1. Accedi a e apri AWS Management Console la console Amazon Bedrock all'indirizzo https://console.aws.amazon.com/bedrock/.

  2. Seleziona Knowledge base nel riquadro di navigazione a sinistra.

  3. Nella sezione Knowledge base, seleziona Crea knowledge base.

  4. Nella pagina Fornisci i dettagli della knowledge base, imposta le seguenti configurazioni:

    1. (Facoltativo) Nella sezione Dettagli della Knowledge Base, modificare il nome predefinito e fornire una descrizione per la Knowledge Base.

    2. Nella sezione Autorizzazioni IAM, scegli un ruolo AWS Identity and Access Management (IAM) che fornisce l'autorizzazione Amazon Bedrock per accedere ad altri AWS servizi. Puoi lasciare che Amazon Bedrock crei il ruolo di servizio o scegliere un ruolo personalizzato che hai creato.

    3. (Facoltativo) Aggiungi tag alla tua knowledge base. Per ulteriori informazioni, consulta Aggiunta di tag alle risorse .

    4. Seleziona Successivo.

  5. Nella pagina Configura l'origine dati, fornisci le informazioni relative all'origine dati da utilizzare per la knowledge base:

    1. (Facoltativo) Modifica il nome predefinito dell'origine dati.

    2. Seleziona Account corrente o Altro account per la posizione dell'origine dati

    3. Fornisci l'URI S3 dell'oggetto contenente i file per l'origine dati che hai preparato. Se selezioni Altro account, potrebbe essere necessario aggiornare la policy del bucket Amazon S3 dell'altro account, la policy delle chiavi AWS KMS e il ruolo della Knowledge Base dell'account corrente.

      Nota

      Scegli un bucket Amazon S3 nella stessa regione della knowledge base che stai creando. In caso contrario, la tua fonte di dati non riuscirà a sincronizzarsi.

    4. Se hai crittografato i dati di Amazon S3 con una chiave gestita dal cliente, seleziona Aggiungi chiave gestita dal cliente per i dati AWS KMS Amazon S3 e scegli una chiave KMS per consentire ad Amazon Bedrock di decrittografarli. Per ulteriori informazioni, consulta Crittografia delle informazioni trasmesse ad Amazon OpenSearch Service.

    5. (Facoltativo) Per configurare le seguenti impostazioni avanzate, espandi la sezione Impostazioni avanzate - opzionale.

      1. Durante la conversione dei dati in incorporamenti, Amazon Bedrock li crittografa con una chiave che AWS possiede e gestisce, per impostazione predefinita. Per utilizzare la tua chiave KMS, espandi Impostazioni avanzate, seleziona Personalizza le impostazioni di crittografia (avanzate) e scegli una chiave. Per ulteriori informazioni, consulta Crittografia dell'archiviazione di dati transitoria durante l'importazione dei dati.

      2. Scegli tra le seguenti opzioni per la strategia di suddivisione in blocchi per la tua fonte di dati:

        • Suddivisione in blocchi predefinita: per impostazione predefinita, Amazon Bedrock suddivide automaticamente i dati di origine in blocchi, in modo che ogni blocco contenga al massimo circa 300 token. Se un documento contiene meno di 300 token, non viene suddiviso ulteriormente.

        • Suddivisione in blocchi a dimensione fissa: Amazon Bedrock divide i dati di origine in blocchi della dimensione approssimativa che hai impostato. Configura le opzioni seguenti.

          • Numero massimo di token: Amazon Bedrock crea blocchi che non superano il numero di token scelto.

          • Percentuale di sovrapposizione tra i blocchi: ogni blocco si sovrappone ai blocchi consecutivi in base alla percentuale scelta.

        • Nessuna suddivisione in blocchi: Amazon Bedrock tratta ogni file come un unico blocco. Se scegli questa opzione, potresti voler pre-elaborare i tuoi documenti suddividendoli in file separati.

        Nota

        Non puoi modificare la strategia di suddivisione in blocchi dopo aver creato l'origine dati.

      3. Scegli tra le seguenti opzioni per la politica di eliminazione dei dati per la tua fonte di dati:

        • Elimina: elimina tutti i dati sottostanti appartenenti all'origine dati dal vector store dopo l'eliminazione di una knowledge base o di una risorsa di origine dati. Nota che il vector store stesso non viene eliminato, ma solo i dati sottostanti. Questo flag viene ignorato se un AWS account viene eliminato.

        • Conserva: conserva tutti i dati sottostanti nell'archivio vettoriale dopo l'eliminazione di una knowledge base o di una risorsa di origine dati.

    6. Seleziona Avanti.

  6. Nella sezione Modello di incorporamento, scegli un modello di incorporamento supportato per convertire i dati in incorporamenti vettoriali per la knowledge base.

  7. Nella sezione Database vettoriale, scegliete una delle seguenti opzioni per memorizzare gli incorporamenti vettoriali per la vostra knowledge base:

    • Crea rapidamente un nuovo archivio vettoriale: Amazon Bedrock crea per te una raccolta di ricerche vettoriali Amazon OpenSearch Serverless. Con questa opzione, vengono configurati automaticamente una raccolta di ricerca vettoriale e un indice vettoriale pubblici con i campi richiesti e le configurazioni necessarie. Dopo aver creato la raccolta, puoi gestirla nella console Amazon OpenSearch Serverless o tramite l' AWS API. Per ulteriori informazioni, consulta Lavorare con le raccolte di ricerca vettoriale nella Amazon OpenSearch Service Developer Guide. Se selezioni questa opzione, puoi facoltativamente abilitare le seguenti impostazioni:

      1. Per abilitare le repliche attive ridondanti, in modo che la disponibilità del tuo archivio vettoriale non venga compromessa in caso di guasto dell'infrastruttura, seleziona Abilita ridondanza (repliche attive).

        Nota

        Ti consigliamo di lasciare questa opzione disabilitata durante il test della knowledge base. Quando sei pronto per la distribuzione in produzione, ti consigliamo di abilitare le repliche attive ridondanti. Per informazioni sui prezzi, consulta Pricing for Serverless OpenSearch

      2. Per crittografare l'archivio vettoriale automatizzato con una chiave gestita dal cliente, seleziona Aggiungi chiave KMS gestita dal cliente per OpenSearch Amazon Serverless vector (opzionale) e scegli la chiave. Per ulteriori informazioni, consulta Crittografia delle informazioni trasmesse ad Amazon OpenSearch Service.

    • Seleziona un archivio vettoriale che hai creato: seleziona il servizio che contiene un database vettoriale che hai già creato. Compila i campi per consentire ad Amazon Bedrock di mappare le informazioni dalla knowledge base al database, in modo che possa archiviare, aggiornare e gestire gli incorporamenti. Per ulteriori informazioni su come questi campi vengono mappati ai campi che hai creato, consulta. Configura un indice vettoriale per la tua knowledge base in un archivio vettoriale supportato

      Nota

      Se utilizzi un database in Amazon OpenSearch Serverless, Amazon Aurora o MongoDB Atlas, devi prima aver configurato i campi in Mappatura dei campi. Se utilizzi un database in Pinecone orRedis Enterprise Cloud, puoi fornire i nomi per questi campi qui e Amazon Bedrock li creerà dinamicamente nell'archivio vettoriale per te.

  8. Seleziona Avanti.

  9. Nella pagina Verifica e crea, controlla la configurazione e i dettagli della knowledge base. Scegli Modifica in qualsiasi sezione che desideri modificare. Quando ritieni che vada tutto bene, seleziona Crea knowledge base.

  10. Il tempo richiesto per creare la knowledge base dipende dalla quantità di dati forniti. Al termine della creazione della knowledge base, lo stato della knowledge base diventa Pronto.

API

Per creare una knowledge base, invia una CreateKnowledgeBaserichiesta a un endpoint di compilazione Agents for Amazon Bedrock e fornisci il nome, la descrizione, le istruzioni su cosa deve fare e il modello di base con cui orchestrare.

Nota

Se preferisci lasciare che Amazon Bedrock crei e gestisca un archivio vettoriale per te in Amazon OpenSearch Service, usa la console. Per ulteriori informazioni, consulta Creazione di una knowledge base.

  • Fornisci all'ARN le autorizzazioni per creare una knowledge base nel campo roleArn.

  • Fornisci il modello di incorporamento da utilizzare nel campo embeddingModelArn dell'oggetto knowledgeBaseConfiguration.

  • Fornisci la configurazione per il tuo archivio vettoriale nell'oggetto storageConfiguration. Per ulteriori informazioni, consulta Configura un indice vettoriale per la tua knowledge base in un archivio vettoriale supportato

    • Per un database Amazon OpenSearch Service, usa l'opensearchServerlessConfigurationoggetto.

    • Per un Pinecone database, usa l'pineconeConfigurationoggetto.

    • Per un Redis Enterprise Cloud database, usa l'redisEnterpriseCloudConfigurationoggetto.

    • Per un database Amazon Aurora, usa l'rdsConfigurationoggetto.

    • Per un database MongoDB Atlas, usa l'oggetto. mongodbConfiguration

Dopo aver creato una knowledge base, crea una fonte di dati dal bucket S3 contenente i file per la tua knowledge base. Per creare l'origine dati, invia una CreateDataSourcerichiesta.

  • Fornisci le informazioni per il bucket S3 contenente i file di origine dati nel dataSourceConfiguration campo.

  • Specificate come suddividere le fonti di dati nel campo. vectorIngestionConfiguration Per ulteriori informazioni, consulta Configura una fonte di dati per la tua knowledge base.

    Nota

    Non è possibile modificare la configurazione della suddivisione in blocchi dopo aver creato l'origine dati.

  • Fornisci il file dataDeletionPolicy per la tua fonte di dati. È possibile accedere a DELETE tutti i dati sottostanti appartenenti all'origine dati dal vector store dopo l'eliminazione di una knowledge base o di una risorsa di origine dati. Nota che il vector store stesso non viene eliminato, ma solo i dati sottostanti. Questo flag viene ignorato se un AWS account viene eliminato. È possibile utilizzare RETAIN tutti i dati sottostanti nel proprio archivio vettoriale dopo l'eliminazione di una knowledge base o di una risorsa di origine dati.

  • (Facoltativo) Durante la conversione dei dati in incorporamenti, Amazon Bedrock li crittografa con una chiave che AWS possiede e gestisce, per impostazione predefinita. Per utilizzare la tua chiave KMS, includila nell'oggetto. serverSideEncryptionConfiguration Per ulteriori informazioni, consulta Crittografia delle risorse della knowledge base.

Configura le configurazioni di sicurezza per la tua knowledge base

Dopo aver creato una knowledge base, potrebbe essere necessario configurare le seguenti configurazioni di sicurezza:

Configura le politiche di accesso ai dati per la tua knowledge base

Se utilizzi un ruolo personalizzato, configura le configurazioni di sicurezza per la knowledge base appena creata. Se consenti ad Amazon Bedrock di creare un ruolo di servizio per te, puoi saltare questo passaggio. Segui i passaggi nella scheda corrispondente al database che hai configurato.

Amazon OpenSearch Serverless

Per limitare l'accesso alla raccolta Amazon OpenSearch Serverless al ruolo di servizio della knowledge base, crea una policy di accesso ai dati. Puoi farlo nei seguenti modi:

Utilizza la seguente politica di accesso ai dati, specificando la raccolta Amazon OpenSearch Serverless e il tuo ruolo di servizio:

[ { "Description": "${data access policy description}", "Rules": [ { "Resource": [ "index/${collection_name}/*" ], "Permission": [ "aoss:DescribeIndex", "aoss:ReadDocument", "aoss:WriteDocument" ], "ResourceType": "index" } ], "Principal": [ "arn:aws:iam::${account-id}:role/${kb-service-role}" ] } ]
Pinecone, Redis Enterprise Cloud or MongoDB Atlas

Per integrare un indice vettoriale MongoDB Atlas PineconeRedis Enterprise Cloud, allega la seguente politica basata sull'identità al ruolo del servizio della Knowledge Base per consentirgli di accedere al segreto per l'indice vettoriale. AWS Secrets Manager

{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "bedrock:AssociateThirdPartyKnowledgeBase" ], "Resource": "*", "Condition": { "StringEquals": { "bedrock:ThirdPartyKnowledgeBaseCredentialsSecretArn": "arn:aws:iam::${region}:${account-id}:secret:${secret-id}" } } }] }

Configura le policy di accesso alla rete per la tua knowledge base Amazon OpenSearch Serverless

Se utilizzi una raccolta privata Amazon OpenSearch Serverless per la tua knowledge base, è possibile accedervi solo tramite un endpoint AWS PrivateLink VPC. Puoi creare una raccolta Amazon OpenSearch Serverless privata quando configuri la tua raccolta vettoriale Amazon OpenSearch Serverless oppure puoi rendere privata una raccolta Amazon Serverless esistente (inclusa una raccolta Amazon OpenSearch Serverless creata per te dalla console Amazon Bedrock) quando configuri la politica di accesso alla rete.

Le seguenti risorse nell'Amazon OpenSearch Service Developer Guide ti aiuteranno a comprendere la configurazione richiesta per una raccolta Amazon OpenSearch Serverless privata:

Per consentire a una knowledge base Amazon Bedrock di accedere a una raccolta Amazon OpenSearch Serverless privata, devi modificare la politica di accesso alla rete per la raccolta Amazon OpenSearch Serverless per consentire Amazon Bedrock come servizio di origine. Seleziona la scheda corrispondente al metodo scelto e segui i passaggi.

Console
  1. Apri la console Amazon OpenSearch Service all'indirizzo https://console.aws.amazon.com/aos/.

  2. Dal riquadro di navigazione a sinistra, seleziona Raccolte. Quindi scegli la tua collezione.

  3. Nella sezione Rete, seleziona la Politica associata.

  4. Scegli Modifica.

  5. Per Seleziona il metodo di definizione della politica, esegui una delle seguenti operazioni:

    • Lascia Select policy definition method come Visual editor e configura le seguenti impostazioni nella sezione Rule 1:

      1. (Facoltativo) Nel campo Nome regola, inserisci un nome per la regola di accesso alla rete.

      2. In Accedi alle raccolte da, seleziona Privato (consigliato).

      3. Seleziona l'accesso privato al AWS servizio. Nella casella di testo, inseriscibedrock.amazonaws.com.

      4. Deseleziona Abilita l'accesso ai OpenSearch dashboard.

    • Scegli JSON e incolla la seguente politica nell'editor JSON.

      [ { "AllowFromPublic": false, "Description":"${network access policy description}", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]
  6. Scegli Aggiorna.

API

Per modificare la politica di accesso alla rete per la tua raccolta Amazon OpenSearch Serverless, procedi come segue:

  1. Invia una GetSecurityPolicyrichiesta con un endpoint OpenSearch Serverless. Specificare name la policy e specificare l'typeas. network Prendere nota dell'ID policyVersion nella risposta.

  2. Invia una UpdateSecurityPolicyrichiesta con un endpoint OpenSearch Serverless. Specificate almeno i seguenti campi:

    Campo Descrizione
    nome Il nome della policy
    Versione della politica Ti hanno policyVersion risposto dalla risposta. GetSecurityPolicy
    tipo Il tipo di policy di sicurezza. Specifica network.
    policy La politica da usare. Specificare il seguente oggetto JSON
    [ { "AllowFromPublic": false, "Description":"${network access policy description}", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]

Per un AWS CLI esempio, vedete Creazione di politiche di accesso ai dati (AWS CLI).

  • Utilizza la console OpenSearch di Amazon Service seguendo la procedura descritta in Creazione di politiche di rete (console). Invece di creare una politica di rete, prendi nota della politica associata nella sottosezione Rete dei dettagli della raccolta.