DetectText - Amazon Rekognition

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

DetectText

入力イメージ内のテキストを検出し、コンピュータが読み取り可能なテキストに変換します。

入力イメージとして、base64 でエンコードされたイメージのバイトとして、または Amazon S3 バケット内のイメージへの参照を渡します。AWS CLI を使用して Amazon Rekognition オペレーションを呼び出す場合は、Amazon S3 バケット内のイメージへの参照としてこのオペレーションを渡す必要があります。AWS CLI の場合、イメージのバイトを渡すことはサポートされていません。イメージは、.png または .jpeg 形式ファイルにする必要があります。

-DetectText操作は、配列内のテキストを返します。TextDetection要素、TextDetections。eachTextDetection要素は、画像内で検出された 1 つの単語またはテキスト行に関する情報を提供します。

単語とは、スペースで区切られていない、1 個以上の ISO 基本ラテンアルファベットです。DetectTextはイメージ内の最大 50 個の単語を検出できます。

行は、等間隔のスペースで区切られた単語の文字列です。行は、必ずしも完全な文とは限りません。たとえば、運転免許証番号は行として検出されます。行は、後に整列するテキストが続かない場合に終わります。また、単語間の間隔が各単語の長さと比べて大きく離れている場合にも、行は終わります。つまり、同じ方向に整列されたテキストAmazon Rekognition、単語間の間隔によっては、で複数の行として検出される場合があります。ピリオドは行の終わりを示しません。文が複数の行にまたがっている場合、DetectText オペレーションは複数の行を返します。

かどうかを判断するには、TextDetection要素がテキスト行または単語のいずれであるかを確認するにはTextDetectionオブジェクトTypefield。

テキストが検出されるのは、水平軸から +/- 90 度以内の向きである場合に限ります。

詳細については、「テキストの検出」を参照してください。

リクエストの構文

{ "Filters": { "RegionsOfInterest": [ { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number } } ], "WordFilter": { "MinBoundingBoxHeight": number, "MinBoundingBoxWidth": number, "MinConfidence": number } }, "Image": { "Bytes": blob, "S3Object": { "Bucket": "string", "Name": "string", "Version": "string" } } }

リクエストパラメータ

リクエストは以下のデータを JSON 形式で受け入れます。

フィルター

テキストが応答に含めるために満たす必要のある条件を設定するためのオプションのパラメーター。

タイプ: DetectTextFilters オブジェクト

: 必須 いいえ

イメージ

base64 でエンコードされたバイトまたは Amazon S3 オブジェクトとしての入力イメージ。AWS CLI を使用して Amazon Rekognition オペレーションを呼び出す場合、イメージバイトを渡すことはできません。

AWS SDK を使用して Amazon Rekognition を呼び出す場合は、Bytesfield。詳細については、「Images」を参照してください。

タイプ: Image オブジェクト

: 必須 はい

レスポンスの構文

{ "TextDetections": [ { "Confidence": number, "DetectedText": "string", "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Id": number, "ParentId": number, "Type": "string" } ], "TextModelVersion": "string" }

レスポンス要素

アクションが成功すると、サービスは HTTP 200 レスポンスを返します。

サービスから以下のデータが JSON 形式で返されます。

TextDetections

入力イメージ内で検出されたテキストの配列です。

タイプ: の配列TextDetectionobjects

TextModelバージョン

テキストの検出に使用されるモデルのバージョン。

タイプ: 文字列

Errors

AccessDeniedException

アクションを実行する権限がありません。

HTTP ステータスコード: 400

ImageTooLargeException

入力イメージサイズが制限文字数を超えています。あなたが呼び出す場合DetectProtectiveEquipmentの場合、イメージサイズまたは解像度が制限文字数を超えています。詳細については、「Guidelines and quotas in Amazon Rekognition」を参照してください。

HTTP ステータスコード: 400

InternalServerError

Amazon Rekognition でサービスの問題が発生しました。もう一度やり直してください。

HTTP ステータスコード: 500

InvalidImageFormatException

指定されたイメージ形式はサポートされていません。

HTTP ステータスコード: 400

InvalidParameterException

入力パラメータが制約に違反しています。API オペレーションを再度呼び出す前にパラメータを検証します。

HTTP ステータスコード: 400

InvalidS3ObjectException

Amazon Rekognition は、リクエストで指定された S3 オブジェクトにアクセスできません。

HTTP ステータスコード: 400

ProvisionedThroughputExceededException

お客様のスループット制限を超えたリクエストの数。この上限を引き上げる場合は、Amazon Rekognition までお問い合わせください。

HTTP ステータスコード: 400

ThrottlingException

Amazon Rekognition は一時的にリクエストを処理できませんでした。もう一度やり直してください。

HTTP ステータスコード: 500

以下の資料も参照してください。

言語固有の AWS SDK のいずれかでこの API を使用する方法の詳細については、以下を参照してください。