DetectText - Amazon Rekognition

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

DetectText

入力イメージ内のテキストを検出し、コンピュータが読み取り可能なテキストに変換します。

入力イメージとして、Base64 でエンコードされたイメージのバイトとして、または Amazon S3 バケット内のイメージへの参照として渡します。AWS CLI を使用して Amazon Rekognition オペレーションを呼び出す場合は、Amazon S3 バケット内のイメージへの参照として渡す必要があります。AWS CLI の場合、イメージのバイトを渡すことはサポートされていません。イメージは、.png または .jpeg 形式ファイルにする必要があります。

-DetectTextオペレーションは、次の配列でテキストを返します。TextDetection要素、TextDetections。eachTextDetection要素は、画像内で検出された単一の単語またはテキスト行に関する情報を提供します。

単語とは、スペースで区切られていない、1 個以上のスクリプトです。DetectTextはイメージ内の最大 100 個の単語を検出できます。

行は、等間隔のスペースで区切られた単語の文字列です。行は、必ずしも完全な文とは限りません。たとえば、運転免許証番号は行として検出されます。行は、後に整列するテキストが続かない場合に終わります。また、単語間の間隔が各単語の長さと比べて大きく離れている場合にも、行は終わります。つまり、同じ方向に整列されたテキストでも、単語間の間隔によっては、Amazon Rekognition で複数の行として検出される場合があります。ピリオドは行の終わりを示しません。文が複数の行にまたがっている場合、DetectText オペレーションは複数の行を返します。

かどうか確認するにはTextDetection要素はテキスト行または単語です。TextDetection対象Typeフィールド。

テキストが検出されるのは、水平軸から +/- 90 度以内の向きである場合に限ります。

詳細については、「テキストの検出」を参照してください。

リクエストの構文

{ "Filters": { "RegionsOfInterest": [ { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number } } ], "WordFilter": { "MinBoundingBoxHeight": number, "MinBoundingBoxWidth": number, "MinConfidence": number } }, "Image": { "Bytes": blob, "S3Object": { "Bucket": "string", "Name": "string", "Version": "string" } } }

リクエストパラメータ

リクエストは以下の JSON 形式のデータを受け入れます。

Filters

テキストが応答に含めるために満たす必要がある条件を設定できるオプションのパラメーター。

型: DetectTextFilters オブジェクト

必須: いいえ

Image

base64 でエンコードされたバイトまたは Amazon S3 オブジェクトとしての入力イメージ。AWS CLI を使用して Amazon Rekognition オペレーションを呼び出す場合、イメージバイトを渡すことはできません。

AWS SDK を使用して Amazon Rekognition を呼び出す場合は、を使用して渡されたイメージバイトを base64 エンコードする必要がない場合があります。Bytesフィールド。詳細については、「イメージの仕様」を参照してください。

型: Image オブジェクト

必須: はい

レスポンスの構文

{ "TextDetections": [ { "Confidence": number, "DetectedText": "string", "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Id": number, "ParentId": number, "Type": "string" } ], "TextModelVersion": "string" }

レスポンス要素

アクションが成功すると、サービスは HTTP 200 レスポンスを返します。

サービスから以下のデータが JSON 形式で返されます。

TextDetections

入力イメージ内で検出されたテキストの配列。

Type: 配列のTextDetectionオブジェクト

TextModelVersion

テキストの検出に使用されるモデルバージョン。

Type: 文字列

エラー

AccessDeniedException

アクションを実行する権限がありません。

HTTP ステータスコード: 400

ImageTooLargeException

入力イメージサイズが制限文字数を超えています。あなたが電話しているならDetectProtectiveEquipmentの場合、イメージサイズまたは解像度が制限文字数を超えています。詳細については、「Amazon Rekognition のガイドラインとクォータ」を参照してください。

HTTP ステータスコード: 400

InternalServerError

Amazon Rekognition でサービスの問題が発生しました。もう一度やり直してください。

HTTP ステータスコード: 500

InvalidImageFormatException

指定されたイメージ形式はサポートされていません。

HTTP ステータスコード: 400

InvalidParameterException

入力パラメータが制約に違反しています。API オペレーションを再度呼び出す前にパラメータを検証します。

HTTP ステータスコード: 400

InvalidS3ObjectException

Amazon Rekognition は、リクエストで指定された S3 オブジェクトにアクセスできません。

HTTP ステータスコード: 400

ProvisionedThroughputExceededException

お客様のスループット制限を超えたリクエストの数。この上限を引き上げる場合は、Amazon Rekognition までお問い合わせください。

HTTP ステータスコード: 400

ThrottlingException

Amazon Rekognition は一時的にリクエストを処理できませんでした。もう一度やり直してください。

HTTP ステータスコード: 500

以下の資料も参照してください。

言語固有の AWS SDK のいずれかでこの API を使用する方法の詳細については、次を参照してください: