訓練自訂實體辨識器模型 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

訓練自訂實體辨識器模型

自訂實體辨識器只會識別您訓練模型時包含的實體類型。它不會自動包括預設圖元類型。如果您也想要識別預設實體類型,例如「位置」、「日期」或「人員」,則需要為這些實體提供額外的訓練資料。

當您使用帶註解的 PDF 檔案建立自訂實體辨識器時,您可以將辨識器與多種輸入檔案格式搭配使用:純文字、影像檔案 (JPG、PNG、TIFF)、PDF 檔案和 Word 文件,無需預先處理或文件平面化。Amazon Comprehend 不支持圖像文件或 Word 文檔的註釋。

注意

使用帶註釋 PDF 檔案的自訂實體辨識器僅支援英文文件。

建立自訂實體辨識器之後,您可以使用DescribeEntityRecognizer作業監視要求的進度。一旦該Status字段是TRAINED,識別器模型就可以用於自定義實體識別。