Verbessern Sie die Widerstandsfähigkeit durch regionsübergreifende Inferenz - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verbessern Sie die Widerstandsfähigkeit durch regionsübergreifende Inferenz

Wenn Sie Model Inference im On-Demand-Modus ausführen, sind Ihre Anfragen möglicherweise durch Servicekontingenten oder zu Spitzenzeiten eingeschränkt. Dank regionsübergreifender Inferenz können Sie ungeplante Datenverkehrsspitzen problemlos bewältigen, indem Sie Rechenleistung auf verschiedene Arten nutzen. AWS-Regionen Mit regionsübergreifender Inferenz können Sie den Datenverkehr auf mehrere AWS-Regionen verteilen, was zu einem höheren Durchsatz und einer erhöhten Ausfallsicherheit in Zeiten hoher Anforderungen führt.

Um regionsübergreifende Inferenz zu verwenden, fügen Sie bei der Ausführung der Modellinferenz ein Inferenzprofil hinzu, indem Sie modelId beim Senden einer InvokeModel, Converse- oder Anfrage die ID des Inferenzprofils angeben. InvokeModelWithResponseStreamConverseStream Ein Inferenzprofil ist eine Abstraktion über einen On-Demand-Ressourcenpool aus der Konfiguration. AWS-Regionen Ein Inferenzprofil kann Ihre Inferenzanforderung, die aus Ihrer Quellregion stammt, an eine andere im Pool konfigurierte Region weiterleiten. Die Verwendung von regionsübergreifender Inferenz erhöht den Durchsatz und verbessert die Ausfallsicherheit, indem Modellaufrufanforderungen dynamisch über die im Inferenzprofil definierten Regionen weitergeleitet werden. Routing beeinflusst den Benutzerverkehr, den Bedarf und die Nutzung von Ressourcen. Die Anfrage wird in der Region erfüllt, aus der sie stammt.

Regionsübergreifende Inferenz ist derzeit für die folgenden Funktionen verfügbar:

Sie können den Durchsatz für ein Modell auch erhöhen, indem Sie Provisioned Throughput erwerben. Inferenzprofile unterstützen derzeit Provisioned Throughput nicht.

Beachten Sie die folgenden Informationen zur regionsübergreifenden Inferenz:

  • Für die Verwendung von regionsübergreifender Inferenz fallen keine zusätzlichen Routing-Kosten an. Der Preis wird auf der Grundlage der Region berechnet, von der aus Sie ein Inferenzprofil aufrufen. Preisinformationen finden Sie unter Amazon Bedrock — Preise.

  • Wenn Sie regionsübergreifende Inferenz verwenden, kann Ihr Durchsatz bis zu doppelt so hoch sein wie die zugewiesenen Kontingente in der Region, in der sich das Inferenzprofil befindet. Die Erhöhung des Durchsatzes gilt nur für Aufrufe, die über Inferenzprofile ausgeführt werden. Das reguläre Kontingent gilt weiterhin, wenn Sie sich für eine regionsinterne Modellaufrufanforderung entscheiden. Wenn Sie sich beispielsweise auf die USA berufen Anthropic Claude 3 Sonnet Inferenzprofil in USA Ost (Nord-Virginia) (US-East-1), Ihr Durchsatz kann bis zu 1.000 Anfragen pro Minute und 2.000.000 Token pro Minute erreichen. Die Standardkontingente für den On-Demand-Durchsatz finden Sie im Abschnitt Runtime-Kontingente in Kontingente für Amazon Bedrock oder verwenden Sie die Service-Kontingents-Konsole.

  • Regionsübergreifende Inferenzanfragen werden innerhalb der Regionen gespeichert, die Teil des verwendeten Inferenzprofils sind. Beispielsweise wird eine Anfrage, die mit einem EU-Inferenzprofil gestellt wurde, innerhalb der EU-Regionen gespeichert.

Weitere Informationen zur regionsübergreifenden Inferenz finden Sie unter Erste Schritte mit regionsübergreifender Inferenz in Amazon Bedrock.