Ausführen einer Batch-Inferenz - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Ausführen einer Batch-Inferenz

Anmerkung

Bei der Batch-Inferenz handelt es sich um eine Vorversion, die Änderungen unterliegt. Batch-Inferenz ist derzeit nur über die API verfügbar. Greifen Sie über die folgenden SDKs auf Batch-APIs zu.

Wir empfehlen, dass Sie eine virtuelle Umgebung für die Verwendung des SDK erstellen. Da Batch-Inferenz-APIs in den neuesten SDKs nicht verfügbar sind, empfehlen wir, dass Sie die neueste Version des SDK aus der virtuellen Umgebung deinstallieren, bevor Sie die Version mit den Batch-Inferenz-APIs installieren. Ein Beispiel mit Anleitungen finden Sie unter. Codebeispiele

Mit Batch-Inferenz können Sie mehrere Inferenzanforderungen asynchron ausführen, um eine große Anzahl von Anforderungen effizient zu verarbeiten, indem Sie Inferenzen für Daten ausführen, die in einem S3-Bucket gespeichert sind. Sie können Batch-Inferenz verwenden, um die Leistung der Modellinferenz bei großen Datensätzen zu verbessern.

Anmerkung

Batch-Inferenz wird für bereitgestellte Modelle nicht unterstützt.

Informationen zu den Kontingenten für Batch-Inferenz finden Sie unter Batch-Inferenz-Kontingente.

Amazon Bedrock unterstützt Batch-Inferenz für die folgenden Modalitäten.

  • Text zu Einbettungen

  • Text zu Text

  • Text zu Bild

  • Bild zu Bild

  • Von Bild zu Einbettungen

Sie speichern Ihre Daten in einem Amazon-S3-Bucket, um sie für Batch-Inferenz vorzubereiten. Anschließend können Sie Batch-Inferenzaufträge mithilfe der ModelInvocationJob-APIs ausführen und verwalten.

Bevor Sie Batch-Inferenz ausführen können, müssen Sie die Berechtigungen zum Aufrufen der Batch-Inferenz-APIs erhalten. Anschließend konfigurieren Sie eine IAM-Servicerolle in Amazon Bedrock so, dass sie über Berechtigungen zur Ausführung von Batch-Inferenzaufträgen verfügt.

Sie können die Batch-Inferenz-APIs verwenden, indem Sie eines der folgenden AWS SDK-Pakete herunterladen und installieren.