Erstellen einer Wissensdatenbank - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen einer Wissensdatenbank

Anmerkung

Sie können keine Wissensdatenbank mit einem Root-Benutzer erstellen. Melden Sie sich mit einem IAM-Benutzer an, bevor Sie mit diesen Schritten beginnen.

Nachdem Sie Ihre Datenquelle in Amazon S3 und einen Vektorspeicher Ihrer Wahl eingerichtet haben, können Sie eine Wissensdatenbank erstellen. Wählen Sie die Registerkarte aus, die der Methode Ihrer Wahl entspricht, und folgen Sie den Schritten.

Console
So erstellen Sie eine Wissensdatenbank
  1. Melden Sie sich bei der AWS Management Console an und öffnen Sie die Amazon Bedrock-Konsole unter https://console.aws.amazon.com/bedrock/.

  2. Wählen Sie im linken Navigationsbereich Wissensdatenbank aus.

  3. Wählen Sie im Abschnitt Wissensdatenbanken die Option Wissensdatenbank erstellen aus.

  4. Richten Sie auf der Seite Wissensdatenbank-Details bereitstellen die folgenden Konfigurationen ein:

    1. (Optional) Ändern Sie im Abschnitt Wissensdatenbank-Details den Standardnamen und geben Sie eine Beschreibung für Ihre Wissensdatenbank ein.

    2. Wählen Sie im Abschnitt IAM-Berechtigungen eine AWS Identity and Access Management (IAM-) Rolle aus, die Amazon Bedrock die Berechtigung zum Zugriff auf andere Services gewährt. AWS Sie können Amazon Bedrock die Servicerolle erstellen lassen oder eine benutzerdefinierte Rolle auswählen, die Sie erstellt haben.

    3. (Optional) Fügen Sie Ihrer Wissensdatenbank Tags hinzu. Weitere Informationen finden Sie unter Markieren von Ressourcen.

    4. Klicken Sie auf Weiter.

  5. Geben Sie auf der Seite Datenquelle einrichten die Informationen für die Datenquelle an, die für die Wissensdatenbank verwendet werden soll:

    1. (Optional) Ändern Sie den Standardnamen der Datenquelle.

    2. Wählen Sie Girokonto oder Anderes Konto als Speicherort der Datenquelle

    3. Geben Sie den S3-URI des Objekts an, das die Dateien für die von Ihnen vorbereitete Datenquelle enthält. Wenn Sie Anderes Konto auswählen, müssen Sie möglicherweise die Amazon S3 S3-Bucket-Richtlinie, die AWS KMS KMS-Schlüsselrichtlinie und die Knowledgebase-Rolle des aktuellen Kontos aktualisieren.

      Anmerkung

      Wählen Sie einen Amazon S3 S3-Bucket in derselben Region aus wie die Wissensdatenbank, die Sie erstellen. Andernfalls kann Ihre Datenquelle nicht synchronisiert werden.

    4. Wenn Sie Ihre Amazon S3 S3-Daten mit einem vom Kunden verwalteten Schlüssel verschlüsselt haben, wählen Sie Kundenverwalteten AWS KMS Schlüssel für Amazon S3 S3-Daten hinzufügen und wählen Sie einen KMS-Schlüssel aus, damit Amazon Bedrock ihn entschlüsseln kann. Weitere Informationen finden Sie unter Verschlüsselung von an Amazon OpenSearch Service übergebenen Informationen.

    5. (Optional) Um die folgenden erweiterten Einstellungen zu konfigurieren, erweitern Sie den Abschnitt Erweiterte Einstellungen — optional.

      1. Bei der Konvertierung Ihrer Daten in Einbettungen verschlüsselt Amazon Bedrock Ihre Daten standardmäßig mit einem Schlüssel, der AWS Eigentümer und Verwalter ist. Um Ihren eigenen KMS-Schlüssel zu verwenden, erweitern Sie Erweiterte Einstellungen, wählen Sie Verschlüsselungseinstellungen anpassen (erweitert) und wählen Sie einen Schlüssel aus. Weitere Informationen finden Sie unter Verschlüsselung der vorübergehenden Datenspeicherung während der Datenerfassung.

      2. Wählen Sie aus den folgenden Optionen für die Chunking-Strategie für Ihre Datenquelle:

        • Standardaufteilung: Standardmäßig teilt Amazon Bedrock Ihre Quelldaten automatisch in Blöcke auf, sodass jeder Block maximal 300 Token enthält. Wenn ein Dokument weniger als 300 Token enthält, wird es nicht weiter aufgeteilt.

        • Feste Größenaufteilung: Amazon Bedrock teilt Ihre Quelldaten in Blöcke mit der von Ihnen festgelegten ungefähren Größe auf. Konfigurieren Sie die folgenden Optionen.

          • Max. Anzahl an Token: Amazon Bedrock erstellt Blöcke, die die Anzahl der von Ihnen ausgewählten Token nicht überschreiten.

          • Prozentsatz der Überlappung zwischen Blöcken: Jeder Block überschneidet sich mit anschließenden Blöcken um den von Ihnen ausgewählten Prozentsatz.

        • Keine Aufteilung: Amazon Bedrock behandelt jede Datei als einen Block. Wenn Sie diese Option wählen, sollten Sie Ihre Dokumente möglicherweise vorab verarbeiten, indem Sie sie in separate Dateien aufteilen.

        Anmerkung

        Sie können die Aufteilungsstrategie nicht mehr ändern, nachdem Sie die Datenquelle erstellt haben.

      3. Wählen Sie aus den folgenden Optionen für die Datenlöschrichtlinie für Ihre Datenquelle:

        • Löschen: Löscht alle zugrunde liegenden Daten, die zur Datenquelle gehören, aus dem Vektorspeicher, wenn eine Wissensdatenbank- oder Datenquellenressource gelöscht wird. Beachten Sie, dass nicht der Vektorspeicher selbst gelöscht wird, sondern nur die zugrunde liegenden Daten. Dieses Kennzeichen wird ignoriert, wenn ein AWS Konto gelöscht wird.

        • Beibehalten: Behält alle zugrunde liegenden Daten in Ihrem Vector Store bei, wenn eine Wissensdatenbank- oder Datenquellenressource gelöscht wird.

    6. Klicken Sie auf Weiter.

  6. Wählen Sie im Abschnitt Einbettungsmodell ein unterstütztes Einbettungsmodell aus, um Ihre Daten in Vektoreinbettungen für die Wissensdatenbank umzuwandeln.

  7. Wählen Sie im Abschnitt Vektordatenbank eine der folgenden Optionen aus, um die Vektoreinbettungen für Ihre Wissensdatenbank zu speichern:

    • Schnelles Erstellen eines neuen Vektorspeichers — Amazon Bedrock erstellt eine Amazon OpenSearch Serverless-Vektorsuchsammlung für Sie. Mit dieser Option werden für Sie eine öffentliche Vektorsuchsammlung und ein Vektorindex mit den erforderlichen Feldern und erforderlichen Konfigurationen eingerichtet. Nachdem die Sammlung erstellt wurde, können Sie sie in der Amazon OpenSearch Serverless-Konsole oder über die AWS API verwalten. Weitere Informationen finden Sie unter Arbeiten mit Vektorsuchsammlungen im Amazon OpenSearch Service Developer Guide. Wenn Sie diese Option auswählen, können Sie optional die folgenden Einstellungen aktivieren:

      1. Um redundante aktive Replikate zu aktivieren, sodass die Verfügbarkeit Ihres Vector Stores im Falle eines Infrastrukturausfalls nicht beeinträchtigt wird, wählen Sie Redundanz aktivieren (aktive Replikate).

        Anmerkung

        Wir empfehlen Ihnen, diese Option deaktiviert zu lassen, während Sie Ihre Wissensdatenbank testen. Wenn Sie für die Bereitstellung in der Produktion bereit sind, empfehlen wir, redundante aktive Replikate zu aktivieren. Informationen zur Preisgestaltung finden Sie unter Preise für Serverless OpenSearch

      2. Um den automatisierten Vektorspeicher mit einem vom Kunden verwalteten Schlüssel zu verschlüsseln, wählen Sie Kundenverwalteten KMS-Schlüssel für Amazon OpenSearch Serverless Vector hinzufügen — optional und wählen Sie den Schlüssel aus. Weitere Informationen finden Sie unter Verschlüsselung von an Amazon OpenSearch Service übergebenen Informationen.

    • Wählen Sie einen von Ihnen erstellten Vektorspeicher aus — Wählen Sie den Service aus, der eine Vektordatenbank enthält, die Sie bereits erstellt haben. Füllen Sie die Felder aus, damit Amazon Bedrock Informationen aus der Wissensdatenbank Ihrer Datenbank zuordnen kann, sodass es diese Einbettungen speichern, aktualisieren und verwalten kann. Weitere Informationen darüber, wie diese Felder den von Ihnen erstellten Feldern zugeordnet werden, finden Sie unterRichten Sie einen Vektorindex für Ihre Wissensdatenbank in einem unterstützten Vektorspeicher ein.

      Anmerkung

      Wenn Sie eine Datenbank in Amazon OpenSearch Serverless, Amazon Aurora oder MongoDB Atlas verwenden, müssen Sie zuvor die Felder unter Feldzuordnung konfiguriert haben. Wenn Sie eine Datenbank in Pinecone oder verwendenRedis Enterprise Cloud, können Sie hier Namen für diese Felder angeben und Amazon Bedrock erstellt sie dynamisch im Vector Store für Sie.

  8. Klicken Sie auf Weiter.

  9. Prüfen Sie auf der Seite Überprüfen und erstellen die Konfiguration und die Details Ihrer Wissensdatenbank. Wählen Sie in einem Abschnitt, den Sie ändern müssen, die Option Bearbeiten aus. Wenn Sie mit den Änderungen zufrieden sind, wählen Sie Wissensdatenbank erstellen aus.

  10. Die Zeit, die zum Erstellen der Wissensdatenbank benötigt wird, hängt von der Menge der von Ihnen bereitgestellten Daten ab. Wenn die Erstellung der Wissensdatenbank abgeschlossen ist, ändert sich der Status der Wissensdatenbank in Bereit.

API

Um eine Wissensdatenbank zu erstellen, senden Sie eine CreateKnowledgeBaseAnfrage mit einem Build-Time-Endpunkt von Agents for Amazon Bedrock und geben Sie den Namen, die Beschreibung, die Anweisungen für die Ausführung und das Basismodell für die Orchestrierung an.

Anmerkung

Wenn Sie es vorziehen, Amazon Bedrock einen Vector Store für Sie in Amazon OpenSearch Service erstellen und verwalten zu lassen, verwenden Sie die Konsole. Weitere Informationen finden Sie unter Erstellen einer Wissensdatenbank.

  • Erteilen Sie dem ARN die Berechtigungen, um eine Wissensdatenbank im Feld roleArn zu erstellen.

  • Geben Sie das Einbettungsmodell an, das im Feld embeddingModelArn im Objekt knowledgeBaseConfiguration verwendet werden soll.

  • Geben Sie die Konfiguration für Ihren Vektorspeicher im Objekt storageConfiguration an. Weitere Informationen finden Sie unter Richten Sie einen Vektorindex für Ihre Wissensdatenbank in einem unterstützten Vektorspeicher ein.

    • Verwenden Sie für eine Amazon OpenSearch Service-Datenbank das opensearchServerlessConfiguration Objekt.

    • Verwenden Sie für eine Pinecone Datenbank das pineconeConfiguration Objekt.

    • Verwenden Sie für eine Redis Enterprise Cloud Datenbank das redisEnterpriseCloudConfiguration Objekt.

    • Verwenden Sie das rdsConfiguration Objekt für eine Amazon Aurora Aurora-Datenbank.

    • Verwenden Sie für eine MongoDB Atlas-Datenbank das mongodbConfiguration Objekt.

Nachdem Sie eine Wissensdatenbank erstellt haben, erstellen Sie eine Datenquelle aus dem S3-Bucket, die die Dateien für Ihre Wissensdatenbank enthält. Um die Datenquelle zu erstellen, senden Sie eine CreateDataSourceAnfrage.

  • Geben Sie die Informationen für den S3-Bucket mit den Datenquellendateien in das dataSourceConfiguration Feld ein.

  • Geben Sie an, wie die Datenquellen im vectorIngestionConfiguration Feld aufgeteilt werden sollen. Weitere Informationen finden Sie unter Richten Sie eine Datenquelle für Ihre Wissensdatenbank ein.

    Anmerkung

    Sie können die Chunking-Konfiguration nicht ändern, nachdem Sie die Datenquelle erstellt haben.

  • Geben Sie das dataDeletionPolicy für Ihre Datenquelle an. Wenn Sie eine Wissensdatenbank oder Datenquellenressource löschen, können Sie DELETE alle zugrunde liegenden Daten, die zur Datenquelle gehören, aus dem Vektorspeicher entfernen. Beachten Sie, dass nicht der Vektorspeicher selbst gelöscht wird, sondern nur die zugrunde liegenden Daten. Dieses Kennzeichen wird ignoriert, wenn ein AWS Konto gelöscht wird. Nach dem Löschen einer Wissensdatenbank- oder Datenquellenressource können Sie RETAIN alle zugrundeliegenden Daten in Ihrem Vector Store abrufen.

  • (Optional) Bei der Konvertierung Ihrer Daten in Einbettungen verschlüsselt Amazon Bedrock Ihre Daten standardmäßig mit einem Schlüssel, der AWS Eigentümer und Verwalter ist. Um Ihren eigenen KMS-Schlüssel zu verwenden, fügen Sie ihn in das Objekt ein. serverSideEncryptionConfiguration Weitere Informationen finden Sie unter Verschlüsselung von Wissensdatenbankressourcen.

Richten Sie Sicherheitskonfigurationen für Ihre Wissensdatenbank ein

Nachdem Sie eine Wissensdatenbank erstellt haben, müssen Sie möglicherweise die folgenden Sicherheitskonfigurationen einrichten:

Richten Sie Datenzugriffsrichtlinien für Ihre Wissensdatenbank ein

Wenn Sie eine benutzerdefinierte Rolle verwenden, richten Sie Sicherheitskonfigurationen für Ihre neu erstellte Wissensdatenbank ein. Wenn Sie Amazon Bedrock eine Servicerolle für Sie erstellen lassen, können Sie diesen Schritt überspringen. Folgen Sie den Schritten auf der Registerkarte, die der Datenbank entspricht, die Sie eingerichtet haben.

Amazon OpenSearch Serverless

Um den Zugriff auf die Amazon OpenSearch Serverless-Sammlung auf die Knowledge-Base-Servicerolle zu beschränken, erstellen Sie eine Datenzugriffsrichtlinie. Sie können dies auf folgende Weise tun:

Verwenden Sie die folgende Datenzugriffsrichtlinie, in der Sie die Amazon OpenSearch Serverless-Sammlung und Ihre Servicerolle angeben:

[ { "Description": "${data access policy description}", "Rules": [ { "Resource": [ "index/${collection_name}/*" ], "Permission": [ "aoss:DescribeIndex", "aoss:ReadDocument", "aoss:WriteDocument" ], "ResourceType": "index" } ], "Principal": [ "arn:aws:iam::${account-id}:role/${kb-service-role}" ] } ]
Pinecone, Redis Enterprise Cloud or MongoDB Atlas

Um einenPinecone,Redis Enterprise Cloud, MongoDB Atlas-Vektorindex zu integrieren, fügen Sie Ihrer Wissensdatenbankdienstrolle die folgende identitätsbasierte Richtlinie hinzu, damit sie auf das AWS Secrets Manager Geheimnis für den Vektorindex zugreifen kann.

{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "bedrock:AssociateThirdPartyKnowledgeBase" ], "Resource": "*", "Condition": { "StringEquals": { "bedrock:ThirdPartyKnowledgeBaseCredentialsSecretArn": "arn:aws:iam::${region}:${account-id}:secret:${secret-id}" } } }] }

Richten Sie Netzwerkzugriffsrichtlinien für Ihre Amazon OpenSearch Serverless-Wissensdatenbank ein

Wenn Sie eine private Amazon OpenSearch Serverless-Sammlung für Ihre Wissensdatenbank verwenden, kann nur über einen AWS PrivateLink VPC-Endpunkt darauf zugegriffen werden. Sie können eine private Amazon OpenSearch Serverless-Sammlung erstellen, wenn Sie Ihre Amazon OpenSearch Serverless-Vektorsammlung einrichten, oder Sie können eine bestehende Amazon OpenSearch Serverless-Sammlung (einschließlich einer, die von der Amazon Bedrock-Konsole für Sie erstellt wurde) privat machen, wenn Sie deren Netzwerkzugriffsrichtlinie konfigurieren.

Die folgenden Ressourcen im Amazon OpenSearch Service Developer Guide helfen Ihnen dabei, die Einrichtung zu verstehen, die für private Amazon OpenSearch Serverless-Sammlungen erforderlich ist:

Um einer Amazon Bedrock-Wissensdatenbank den Zugriff auf eine private Amazon OpenSearch Serverless-Sammlung zu ermöglichen, müssen Sie die Netzwerkzugriffsrichtlinie für die Amazon OpenSearch Serverless-Sammlung bearbeiten, um Amazon Bedrock als Quellservice zuzulassen. Wählen Sie die Registerkarte aus, die der Methode Ihrer Wahl entspricht, und folgen Sie den Schritten.

Console
  1. Öffnen Sie die Amazon OpenSearch Service-Konsole unter https://console.aws.amazon.com/aos/.

  2. Wählen Sie im linken Navigationsbereich Sammlungen aus. Wählen Sie dann Ihre Sammlung aus.

  3. Wählen Sie im Bereich Netzwerk die zugehörige Richtlinie aus.

  4. Wählen Sie Bearbeiten aus.

  5. Führen Sie unter Methode zur Richtliniendefinition auswählen einen der folgenden Schritte aus:

    • Belassen Sie die Option Methode zur Richtliniendefinition auswählen auf Visueller Editor und konfigurieren Sie die folgenden Einstellungen im Abschnitt Regel 1:

      1. (Optional) Geben Sie im Feld Regelname einen Namen für die Netzwerkzugriffsregel ein.

      2. Wählen Sie unter Zugriff auf Sammlungen von die Option Privat (empfohlen) aus.

      3. Wählen Sie AWS Dienst mit privatem Zugriff aus. Geben Sie in das Textfeld einbedrock.amazonaws.com.

      4. Deaktivieren Sie die Option Zugriff auf OpenSearch Dashboards aktivieren.

    • Wählen Sie JSON und fügen Sie die folgende Richtlinie in den JSON-Editor ein.

      [ { "AllowFromPublic": false, "Description":"${network access policy description}", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]
  6. Wählen Sie Aktualisieren.

API

Gehen Sie wie folgt vor, um die Netzwerkzugriffsrichtlinie für OpenSearch Ihre Amazon Serverless-Sammlung zu bearbeiten:

  1. Senden Sie eine GetSecurityPolicyAnfrage mit einem OpenSearch serverlosen Endpunkt. Geben Sie den Typ name der Richtlinie an und geben Sie den Namen type als network an. Beachten Sie die policyVersion in der Antwort.

  2. Senden Sie eine UpdateSecurityPolicyAnfrage mit einem OpenSearch serverlosen Endpunkt. Geben Sie mindestens die folgenden Felder an:

    Feld Beschreibung
    name Der Name der Richtlinie.
    Version der Richtlinie Die ist von der GetSecurityPolicy Antwort zu Ihnen policyVersion zurückgekehrt.
    Typ Der Typ der Sicherheitsrichtlinie. Geben Sie an network.
    policy Die zu verwendende Richtlinie. Geben Sie das folgende JSON-Objekt an
    [ { "AllowFromPublic": false, "Description":"${network access policy description}", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]

Ein AWS CLI Beispiel finden Sie unter Datenzugriffsrichtlinien erstellen (AWS CLI).

  • Verwenden Sie die Amazon OpenSearch Service-Konsole, indem Sie den Schritten unter Netzwerkrichtlinien erstellen (Konsole) folgen. Anstatt eine Netzwerkrichtlinie zu erstellen, notieren Sie sich die zugehörige Richtlinie im Unterabschnitt Netzwerk der Erfassungsdetails.