本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
訓練自訂實體辨識器模型
自訂實體辨識器只會識別您訓練模型時包含的實體類型。它不會自動包括預設圖元類型。如果您也想要識別預設實體類型,例如「位置」、「日期」或「人員」,則需要為這些實體提供額外的訓練資料。
當您使用帶註解的 PDF 檔案建立自訂實體辨識器時,您可以將辨識器與多種輸入檔案格式搭配使用:純文字、影像檔案 (JPG、PNG、TIFF)、PDF 檔案和 Word 文件,無需預先處理或文件平面化。Amazon Comprehend 不支持圖像文件或 Word 文檔的註釋。
注意
使用帶註釋 PDF 檔案的自訂實體辨識器僅支援英文文件。
建立自訂實體辨識器之後,您可以使用DescribeEntityRecognizer作業監視要求的進度。一旦該Status
字段是TRAINED
,識別器模型就可以用於自定義實體識別。