偵測文字 - Amazon Rekognition

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

偵測文字

Amazon Rekognition 可以偵測映像和影片中的文字。然後,它可以將偵測到的文字轉換為機器可讀取的文字。您可以使用映像中的機器可讀取文字偵測來實作解決方案,例如:

  • 視覺搜尋。例如,擷取和顯示包含相同文字的映像。

  • 內容見解。例如,針對發生在擷取的影片影格中所辨識到的文字主題提供見解。您的應用程式可以搜尋辨識出的文字以找出相關內容,例如,新聞、運動比數、運動員號碼和字幕。

  • 導覽。例如,開發支援語音功能的手機應用程式,協助視障使用者辨識餐廳名稱、商店或街道指標。

  • 公共安全與交通協助。例如,從交通監視器映像中偵測車牌號碼。

  • 篩選。例如,從映像中篩選出個人身分識別資訊 (PII)。

對於影片中的文字偵測,您可以實作解決方案,例如:

  • 搜尋影片中包含特定文字關鍵字的片段,例如新聞節目畫面中的來賓姓名。

  • 透過偵測意外文字、褻瀆或垃圾郵件,管制內容以符合組織標準。

  • 尋找視訊時間軸上的所有文字浮水印以執行進一步處理,例如用其他語言替換文字以達成內容國際化。

  • 尋找文字位置,以便可以相應地對齊其他圖形。

若要偵測 JPEG 或 PNG 格式影像中的文字,請使用DetectText操作。若要以非同步方式偵測視訊中的文字,請使用StartTextDetectionGetTextDetection作業。映像和影片文字偵測作業都支援大多數字型,包括高度風格化的字型。偵測文字之後,Amazon Rekognition 會建立偵測到的字詞和文字行的代表法,顯示兩者間的關聯,並顯示文字在映像或影片影格中的位置。

DetectTextGetTextDetection 操作會偵測文字和線條。單詞是一個或多個不用空格分隔的腳本字符。DetectText 最多可以偵測映像中的 100 個單詞。GetTextDetection 每幀影片還可以偵測多達 100 個單詞。

單詞是一或多個腳本字符,不以空格分隔。Amazon Rekognition 專為偵測英文、阿拉伯文、俄文、德文、法文、義大利文、葡萄牙文和西班牙文單詞。

文字行是一串等距的字詞。文字行不一定是完整的句子 (句點不表示行的結尾)。例如,Amazon Rekognition 偵測結果為一行文字。當單詞後面沒有對齊或文字之間存在較大的間隙 (相對於字詞的長度) 時,文字行結束。Amazon Rekognition 根據單字間的間隔,可能會偵測以相同方向對齊的多行文字。如果句子跨越多行,此操作會傳回多行文字。

請參考下列映像:

咖啡杯與笑臉和文本「這是星期一,但保持微笑」,邊界框和提取的文本..

藍色方塊代表 DetectText 操作所傳回的偵測到的文字和文字位置的相關資訊。在此範例中,Amazon Rekognition 會將「IT's」、「MONDAY」、「but」、「keep」和「Smiling」偵測為單字。Amazon Rekognition 將「IT's」、「MONDAY」、「but」、「keep」和「Smiling」偵測為文字行。文字必須在水平軸 +/- 90 度方向的範圍內才可被偵測到。

如需範例,請參閱在映像中偵測文字