Fügen Sie mit der Konsole kontextbezogene Erdungsprüfungen hinzu Kontextuelle Erdungsprüfung mit Invoke aufrufen APIs Kontextuelle Erdungsprüfung aufrufen mit Converse APIs Kontextuelle Erdungsprüfung mit API aufrufen ApplyGuardrail

Verwenden Sie die kontextuelle Erdungsprüfung, um Halluzinationen in Antworten zu filtern

Amazon Bedrock Guardrails unterstützt kontextuelle Erdungsprüfungen, um Halluzinationen in Modellantworten zu erkennen und zu filtern, wenn eine Referenzquelle und eine Benutzerabfrage bereitgestellt werden. Die unterstützten Anwendungsfälle umfassen Retrieval-Augmented Generation (RAG), Zusammenfassungs-, Paraphrasierungs- oder Konversationsagenten, die auf eine Referenzquelle wie abgerufene Passagen in RAG oder den Konversationsverlauf zurückgreifen, damit Agenten die Konversationen untermauern können.

Bei kontextuellen Grounding-Checks wird die Relevanz jedes verarbeiteten Chunks überprüft. Wenn ein Teil als relevant erachtet wird, gilt die gesamte Antwort als relevant, da sie die Antwort auf die Anfrage des Benutzers enthält. Bei der Streaming-API kann dies zu einem Szenario führen, in dem eine irrelevante Antwort an den Benutzer zurückgegeben wird, die erst als irrelevant markiert wird, nachdem die gesamte Antwort gestreamt wurde.

Bei der Überprüfung der kontextuellen Erdung wird anhand von zwei Paradigmen geprüft, ob Halluzinationen vorliegen:

Grounding — Dabei wird geprüft, ob die Modellantwort auf der Grundlage der Quelle sachlich korrekt ist und auf der Quelle basiert. Alle neuen Informationen, die in der Antwort enthalten sind, werden als unbegründet betrachtet.
Relevanz — Dadurch wird geprüft, ob die Modellantwort für die Benutzeranfrage relevant ist.

Stellen Sie sich ein Beispiel vor, in dem die Referenzquelle „London ist die Hauptstadt des Vereinigten Königreichs“ enthält. Tokio ist die Hauptstadt Japans“ und die Benutzerabfrage lautet „Was ist die Hauptstadt von Japan?“. Eine Antwort wie „Die Hauptstadt Japan ist London“ wird als unbegründet und sachlich falsch angesehen, wohingegen eine Antwort wie „Die Hauptstadt des Vereinigten Königreichs ist London“ als irrelevant angesehen wird, auch wenn sie korrekt und in der Quelle begründet ist.

Anmerkung

Wenn eine Anfrage mehrere grounding_source Tags enthält, kombiniert und bewertet die Leitplanke alle bereitgestellten grounding_source Werte zusammen, anstatt sie einzeln zu betrachten. grounding_source Dieses Verhalten ist für das Tag identisch. query

Anmerkung

Die Richtlinie zur kontextuellen Erdung unterstützt derzeit maximal 100.000 Zeichen für die Erdungsquelle, 1.000 Zeichen für die Abfrage und 5.000 Zeichen für die Antwort.

Konfidenzwerte und Schwellenwerte

Bei kontextuellen Bodenprüfungen werden für jede Modellantwort, die auf der Grundlage der angegebenen Quelle und Benutzerabfrage verarbeitet wird, Konfidenzwerte generiert, die der Grundlage und der Relevanz entsprechen. Sie können Schwellenwerte konfigurieren, um Modellantworten auf der Grundlage der generierten Werte zu filtern. Der Filterschwellenwert bestimmt den minimal zulässigen Konfidenzwert, damit die Modellantwort in Ihrer generativen KI-Anwendung als fundiert und relevant angesehen werden kann. Wenn Ihr Grundschwellenwert und Ihr Relevanzschwellenwert beispielsweise jeweils auf 0,7 festgelegt sind, werden alle Modellantworten mit einem Grounding- oder Relevanzwert von weniger als 0,7 als Halluzinationen erkannt und in Ihrer Anwendung blockiert. Wenn der Filterschwellenwert erhöht wird, steigt die Wahrscheinlichkeit, dass unbegründete und irrelevante Inhalte blockiert werden, und die Wahrscheinlichkeit, dass halluzinierte Inhalte in Ihrer Anwendung angezeigt werden, sinkt. Sie können Schwellenwerte für Erdung und Relevanz zwischen 0 und 0,99 konfigurieren. Ein Schwellenwert von 1 ist ungültig, da dadurch der gesamte Inhalt blockiert wird.

Für kontextbezogene Erdungsprüfungen sind drei Komponenten erforderlich: die Erdungsquelle, die Abfrage und der zu schützende Inhalt (oder die Modellantwort). Diese sind unterschiedlich konfiguriert, je nachdem, ob Sie Invoke oder direkt APIs verwenden. Converse APIs ApplyGuardrail

Grundquelle — Kontextinformationen, die zur Beantwortung von Benutzeranfragen benötigt werden. Zum Beispiel: „London ist die Hauptstadt des Vereinigten Königreichs. Tokio ist die Hauptstadt Japan.“
Anfrage — eine Frage, die ein Benutzer stellen kann. Zum Beispiel „Was ist die Hauptstadt von Japan?“.
Zu schützender Inhalt — der Text, der im Verhältnis zur Ausgangsquelle und -abfrage geschützt werden sollte. Für Invoke and ist dies Converse APIs die Modellantwort. Dies kann beispielsweise „Die Hauptstadt Japan ist Tokio“ sein.

Unbegründetes Beispiel

Quelle: „London ist die Hauptstadt des Vereinigten Königreichs. Tokio ist die Hauptstadt Japan.“
Anfrage - „Was ist die Hauptstadt von Japan?“
Zufrieden zu bewachen - „Die Hauptstadt Japan ist London.“

In diesem Beispiel ist der Inhalt, der geschützt werden soll, für die Abfrage relevant, hat aber keinen Bezug, da er die Erdungsquelle nicht korrekt verwendet. Dies hätte einen niedrigen Grounding Score zur Folge.

Irrelevantes Beispiel

Grundlegende Quelle: „London ist die Hauptstadt des Vereinigten Königreichs. Tokio ist die Hauptstadt Japan.“
Anfrage - „Was ist die Hauptstadt von Japan?“
Content to guard - „Die Hauptstadt von Großbritannien ist London.“

In diesem Beispiel ist der zu schützende Inhalt unbegründet, aber nicht relevant. Es verwendet Informationen aus der Erdungsquelle, beantwortet die Anfrage jedoch nicht. Dies hätte einen niedrigen Relevanzwert.

Unbegründetes und irrelevantes Beispiel

Fundstelle: „London ist die Hauptstadt des Vereinigten Königreichs. Tokio ist die Hauptstadt Japan.“
Anfrage - „Was ist die Hauptstadt von Japan?“
Zufrieden mit Bewachung - „Draußen regnet es.“

In diesem Beispiel ist der Inhalt, der geschützt werden soll, nicht begründet und nicht relevant. Es verwendet weder Informationen aus der Erdungsquelle noch beantwortet es die Anfrage. Dies hätte einen niedrigen Grundwert und einen niedrigen Relevanzwert.

Weitere Beispiele

Stellen Sie sich eine Bankanwendung vor, die darauf ausgelegt ist, Fragen im Zusammenhang mit Gebühren und Entgelten zu beantworten.

Quelle:

Für die Eröffnung eines Girokontos fallen keine Gebühren an.
Die monatliche Gebühr für die Führung eines Girokontos beträgt 10 USD.
Für internationale Überweisungen wird eine Transaktionsgebühr von 1% erhoben.
Für Inlandsüberweisungen fallen keine Gebühren an.
Die Gebühren im Zusammenhang mit verspäteten Zahlungen von Kreditkartenrechnungen betragen 23,99%.

Basierend auf der obigen Quelle kann es je nach Anfrage des Benutzers vier Szenarien geben.

Fundiert und relevant

F: Welche Gebühren sind mit einem Girokonto verbunden?
A: Die monatliche Gebühr für die Führung eines Girokontos beträgt 10 USD. Für Inlandsüberweisungen fallen keine Gebühren an. Für internationale Überweisungen wird jedoch eine Transaktionsgebühr von 1% erhoben. Für die Eröffnung eines Girokontos fallen keine Gebühren an.

Unbegründet, aber relevant

F: Wie hoch ist die mit Kreditkarte verbundene Transaktionsgebühr?
A: Die mit der Kreditkarte verbundenen Transaktionsgebühren betragen 23,99%.

Begründet, aber irrelevant

F: Wie hoch sind die Gebühren für die Nutzung eines Girokontos?
A: Den bereitgestellten Informationen zufolge beträgt die Gebühr für verspätete Zahlungen bei einer Kreditkarte 23,99%.

Unbegründet und irrelevant

F: Wie hoch sind die Gebühren für die Nutzung eines Girokontos?
A: Die Gebühren für das Maklerkonto betragen 0,5 USD pro Handelstransaktion.

Themen

Fügen Sie mit der Konsole kontextbezogene Erdungsprüfungen hinzu
Kontextuelle Erdungsprüfung mit Invoke aufrufen APIs
Kontextuelle Erdungsprüfung aufrufen mit Converse APIs
Kontextuelle Erdungsprüfung mit API aufrufen ApplyGuardrail

Fügen Sie mit der Konsole kontextbezogene Erdungsprüfungen hinzu

Melden Sie sich bei der AWS Management Console mit einer IAM-Identität an, die berechtigt ist, die Amazon Bedrock-Konsole zu verwenden. Öffnen Sie dann die Amazon Bedrock-Konsole unter https://console.aws.amazon.com/bedrock.
Wählen Sie im linken Navigationsbereich Guardrails und anschließend Create Guardrails aus.
Gehen Sie auf der Seite „Leitplankendetails angeben“ wie folgt vor:
1. Geben Sie im Abschnitt Details zur Leitplanke einen Namen und optional eine Beschreibung für die Leitplanke ein.
2. Geben Sie unter Nachrichten für blockierte Eingabeaufforderungen eine Meldung ein, die angezeigt wird, wenn Ihre Schutzplanke angewendet wird. Aktivieren Sie das Kontrollkästchen Dieselbe blockierte Nachricht auf Antworten anwenden, um dieselbe Nachricht zu verwenden, wenn Ihre Leitplanke auf die Antwort angewendet wird.
3. (Optional) Um die regionsübergreifende Inferenz für Ihre Leitplanke zu aktivieren, erweitern Sie die Option Regionalübergreifende Inferenz und wählen Sie dann Regionsübergreifende Inferenz für Ihre Leitplanke aktivieren aus. Wählen Sie ein Leitplankenprofil, das das Ziel definiert, an das Leitplanken-Inferenzanfragen weitergeleitet werden können. AWS-Regionen
4. (Optional) Standardmäßig ist Ihre Leitplanke mit einem verschlüsselt. Von AWS verwalteter Schlüssel Wenn Sie Ihren eigenen, vom Kunden verwalteten KMS-Schlüssel verwenden möchten, erweitern Sie die KMS-Schlüsselauswahl und aktivieren Sie das Kontrollkästchen Verschlüsselungseinstellungen anpassen (erweitert).
  
  Sie können einen vorhandenen AWS KMS Schlüssel auswählen oder Schlüssel erstellen auswählen, um einen neuen AWS KMS Schlüssel zu erstellen.
5. (Optional) Um Ihrer Leitplanke Tags hinzuzufügen, erweitern Sie den Bereich Tags und wählen Sie dann für jedes von Ihnen definierte Tag die Option Neues Tag hinzufügen aus.
  
  Weitere Informationen finden Sie unter Verschlagwortung von Amazon Bedrock-Ressourcen.
6. Wählen Sie Weiter aus.
Konfigurieren Sie auf der Seite „Kontextuelle Erdungsprüfung hinzufügen“ Schwellenwerte, um unbegründete oder irrelevante Informationen zu blockieren.

Anmerkung
Für jede Art von Prüfung können Sie den Schieberegler bewegen oder einen Schwellenwert zwischen 0 und 0,99 eingeben. Wählen Sie einen geeigneten Schwellenwert für Ihre Zwecke aus. Ein höherer Schwellenwert setzt voraus, dass Antworten begründet oder relevant sind und ein hohes Maß an Sicherheit bieten, um zulässig zu sein. Antworten unter dem Schwellenwert werden gefiltert.
1. Wählen Sie im Feld Erdung die Option Erdungsprüfung aktivieren aus, um zu überprüfen, ob die Antworten des Modells auf dem Fundament basieren.
2. Wählen Sie im Feld Relevanz die Option Relevanzprüfung aktivieren aus, um zu überprüfen, ob die Modellantworten relevant sind.
3. Wenn Sie mit der Konfiguration der Filter für vertrauliche Informationen fertig sind, wählen Sie Weiter oder Zur Überprüfung und Erstellung überspringen aus.

Kontextuelle Erdungsprüfung mit Invoke aufrufen APIs

Um die Erdungsquelle und die Abfrage innerhalb der Eingabe zu markieren, stellen wir zwei Tags zur Verfügung, die genauso funktionieren wie Eingabe-Tags. Diese Tags sind amazon-bedrock-guardrails-groundingSource_xyz und amazon-bedrock-guardrails-query_xyz vorausgesetzt, das Tag-Suffix ist xyz. Zum Beispiel:


{
    "text": """
<amazon-bedrock-guardrails-groundingSource_xyz>London is the capital of UK. Tokyo is the capital of Japan. </amazon-bedrock-guardrails-groundingSource_xyz>

<amazon-bedrock-guardrails-query_xyz>What is the capital of Japan?</amazon-bedrock-guardrails-query_xyz>
""",
    "amazon-bedrock-guardrailConfig": {
        "tagSuffix": "xyz",
    },
}

Beachten Sie, dass die Modellantwort für die Durchführung der kontextuellen Grundungsprüfungen erforderlich ist. Daher werden die Prüfungen nur bei der Ausgabe und nicht bei der Eingabeaufforderung durchgeführt.

Diese Tags können zusammen mit den GuardContent-Tags verwendet werden. Wenn keine GuardContent-Tags verwendet werden, wendet die Guardrail standardmäßig alle konfigurierten Richtlinien auf die gesamte Eingabe an, einschließlich der Grundquelle und der Abfrage. Wenn die GuardContent-Tags verwendet werden, untersucht die Richtlinie für die kontextuelle Erdungsprüfung nur die Erdungsquelle, -abfrage und -antwort, während die übrigen Richtlinien den Inhalt innerhalb der GuardContent-Tags untersuchen.

Kontextuelle Erdungsprüfung aufrufen mit Converse APIs

Um die Erdungsquelle zu markieren und abzufragen Converse APIs, verwenden Sie das Qualifier-Feld in jedem Guard-Inhaltsblock. Zum Beispiel:


[
    {
        "role": "user",
        "content": [
            {
                "guardContent": {
                    "text": {
                        "text": "London is the capital of UK. Tokyo is the capital of Japan",
                        "qualifiers": ["grounding_source"],
                    }
                }
            },
            {
                "guardContent": {
                    "text": {
                        "text": "What is the capital of Japan?",
                        "qualifiers": ["query"],
                    }
                }
            },
        ],
    }
]

Beachten Sie, dass die Modellantwort für die Durchführung der kontextbezogenen Erdungsprüfungen erforderlich ist. Daher werden die Prüfungen nur bei der Ausgabe und nicht bei der Aufforderung durchgeführt.

Wenn keiner der Inhaltsblöcke mit dem Qualifier guard_content gekennzeichnet ist, untersucht die Richtlinie für kontextuelle Grundprüfungen nur die Erdungsquelle, die Abfrage und die Antwort. Die übrigen Richtlinien folgen dem Standardverhalten bei der Untersuchung: Die Systemaufforderung wird standardmäßig nicht untersucht und Nachrichten werden standardmäßig untersucht. Wenn ein Inhaltsblock jedoch mit dem Qualifier guard_content gekennzeichnet ist, untersucht die Richtlinie für kontextuelle Erdungsüberprüfungen nur die Quelle, Anfrage und Antwort, während die übrigen Richtlinien den Inhalt untersuchen, der mit den GuardContent-Tags gekennzeichnet ist.

Kontextuelle Erdungsprüfung mit API aufrufen ApplyGuardrail

Die Verwendung der kontextuellen Erdungsprüfung mit ähnelt der Verwendung mit ApplyGuardrail der. Converse APIs Verwenden Sie das Qualifier-Feld in jedem InhaltsblockApplyGuardrail, um die Erdungsquelle zu markieren und abzufragen. Da ein Modell jedoch nicht mit aufgerufen wirdApplyGuardrail, müssen Sie auch einen zusätzlichen Inhaltsblock mit dem Inhalt angeben, der geschützt werden soll. Dieser Inhaltsblock kann optional mit guard_content qualifiziert werden und entspricht der Modellantwort in Invoke* oder Converse*. APIs Zum Beispiel:


[
    {
        "text": {
            "text": "London is the capital of UK. Tokyo is the capital of Japan",
            "qualifiers": [
                "grounding_source"
            ]
        }
    },
    {
        "text": {
            "text": "What is the capital of Japan?",
            "qualifiers": [
                "query"
            ]
        }
    },
    {
        "text": {
            "text": "The capital of Japan is Tokyo."
        }
    }
]

Beachten Sie, dass die Modellantwort für die Durchführung der kontextuellen Grundprüfungen erforderlich ist. Daher werden die Prüfungen nur bei der Ausgabe und nicht bei der Eingabeaufforderung durchgeführt.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Fügen Sie Filter für vertrauliche Informationen hinzu

Optionen für den Umgang mit schädlichen Inhalten