Bildspezifikationen - Amazon Rekognition

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Bildspezifikationen

Amazon-Rekognition-Image-Operationen können Bilder im .jpg- oder .png-Format analysieren.

Sie übergeben Bild-Bytes an eine Amazon-Rekognition-Image-Operation als Teil des Aufrufs oder Sie verweisen auf ein vorhandenes Amazon-S3-Objekt. Ein Beispiel für die Analyse eines Bildes, das in einem Amazon-S3-Bucket gespeichert ist, finden Sie unter Analysieren von Bildern, die in einem Amazon-S3-Bucket gespeichert sind. Ein Beispiel für die Übergabe von Bild-Bytes an eine Amazon-Rekognition-Image-API-Operation finden Sie unter Analysieren eines aus einem lokalen Dateisystem geladenen Bildes.

Wenn Sie HTTP verwenden und die Bild-Bytes als Teil einer Amazon-Rekognition-Image-Operation übertragen, müssen die Bild-Bytes als base64-kodierte Zeichenfolge vorliegen. Wenn Sie das AWS-SDK verwenden und Bild-Bytes als Teil des API-Operation-Aufrufs übertragen, hängt es von Ihrer verwendeten Sprache ab, ob Sie die Bild-Bytes base64 kodieren müssen.

Die folgenden gängigen AWS SDKs kodieren Bilder automatisch mit Base64, und Sie müssen keine Bildbytes codieren, bevor Sie einen Amazon Rekognition Image API-Vorgang aufrufen.

  • Java

  • JavaScript

  • Python

  • PHP

Wenn Sie ein anderes AWS-SDK verwenden und beim Aufruf einer Rekognition-API-Operation einen Bildformatfehler erhalten, versuchen Sie die Codierung in base64 Bild-Bytes, bevor Sie sie an eine Rekognition-API-Operation übergeben.

Wenn Sie Amazon Rekognition Image-Operationen aufrufen, wird die Übergabe von Bildbytes als Teil des Aufrufs nicht unterstützt. AWS CLI Sie müssen das Bild zuerst auf einen Amazon S3-Bucket hochladen und anschließend die Operation mit Verweis auf das hochgeladene Bild aufrufen.

Anmerkung

Das Bild muss nicht base64-codiert werden, wenn Sie ein Bild übergeben, das in einem S3Object anstatt in Bild-Bytes gespeichert ist.

Informationen zur Sicherstellung der geringstmöglichen Latenz für Amazon-Rekognition-Image-Operationen finden Sie unter Latenz der Amazon-Rekognition-Image-Operation.

Korrigieren der Bildausrichtung

In mehreren Amazon-Rekognition-API-Operationen wird die Ausrichtung eines analysierten Bildes zurückgegeben. Es ist wichtig, die Bildausrichtung zu kennen, da dies Ihnen ermöglicht, Bilder für die Anzeige neu auszurichten. Rekognition-API-Operationen, die Gesichter analysieren, geben auch Begrenzungsrahmen für die Position von Gesichtern innerhalb eines Bilds zurück. Sie können die Begrenzungsrahmen verwenden, um einen Rahmen um ein Gesicht herum auf einem Bild anzuzeigen. Die zurückgegebenen Koordinaten der Begrenzungsrahmen werden von der Bildausrichtung beeinflusst, und Sie müssen die Koordinaten der Begrenzungsrahmen eventuell übertragen, damit der Rahmen um ein Gesicht korrekt angezeigt wird. Weitere Informationen finden Sie unter Erhalten der Bildausrichtung und der Koordinaten von Begrenzungsrahmen.

Größe eines Bilds anpassen

Während der Analyse passt Amazon Rekognition die Größe von Bildern intern anhand einer Reihe vordefinierter Bereiche an, die am besten zu einem bestimmten Modell oder Algorithmus passen. Aus diesem Grund kann Amazon Rekognition je nach Auflösung des Eingabebilds eine unterschiedliche Anzahl von Objekten erkennen oder unterschiedliche Ergebnisse liefern. Nehmen wir an, Sie haben zwei Bilder. Das erste Bild hat eine Auflösung von 1024x768 Pixeln. Das zweite Bild, eine verkleinerte Version des ersten Bildes, hat eine Auflösung von 640x480 Pixeln. Wenn Sie die Bilder an senden DetectLabels, DetectLabels können sich die Antworten der beiden Aufrufe an geringfügig unterscheiden.