本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
執行非同步任務
訓練自訂分類器之後,您可以使用非同步任務來分析一個批次中的大型文件或多個文件。
自訂分類接受各種輸入文件類型。如需詳細資訊,請參閱 非同步自訂分析的輸入。
如果您打算分析映像檔案或掃描PDF的文件,您的IAM政策必須授予許可,才能使用兩種 Amazon Textract API方法 (DetectDocumentText 和 AnalyzeDocument)。Amazon Comprehend 在文字擷取期間調用這些方法。如需政策範例,請參閱 執行文件分析動作所需的許可。
對於使用純文字模型分類半結構化文件 (影像PDF、 或 Docx 檔案),請使用one document per file
輸入格式。此外,請在您的StartDocumentClassificationJob請求中包含 DocumentReaderConfig
參數。