自訂實體辨識 (API) 的即時分析 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

自訂實體辨識 (API) 的即時分析

您可以使用 Amazon Comprehend API 透過自訂模型執行即時分析。首先,您要建立端點來執行即時分析。建立端點之後,即可執行即時分析。

如需佈建端點輸送量及相關成本的相關資訊,請參閱使用 Amazon Comprehend 端點

建立用於自訂實體偵測的端點

如需與端點相關聯之成本的資訊,請參閱使用 Amazon Comprehend 端點

建立端點 AWS CLI

若要使用建立端點AWS CLI,請使用以下create-endpoint指令:

$ aws comprehend create-endpoint \ > --desired-inference-units number of inference units \ > --endpoint-name endpoint name \ > --model-arn arn:aws:comprehend:region:account-id:model/example \ > --tags Key=Key,Value=Value

如果您的命令成功,Amazon Comprehend 會使用端點 ARN 回應:

{ "EndpointArn": "Arn" }

若要取得有關此指令、其參數引數及其輸出的更多資訊,請參閱《AWS CLI指令參考》create-endpoint中的〈〉。

執行即時自訂實體偵測

為自訂實體辨識器模型建立端點後,您可以使用端點執行 DetectEntitiesAPI 作業。您可以使用textbytes參數提供文字輸入。使用參數輸入其他輸入類bytes型。

對於影像檔案和 PDF 檔案,您可以使用DocumentReaderConfig參數來取代預設文字萃取動作。如需詳細資訊,請參閱 設定文字擷取選項

使用偵測文字中的圖元 AWS CLI

若要偵測文字中的自訂實體,請使用text參數中的輸入文字執行detect-entities指令。

範例 :使用 CLI 偵測輸入文字中的實體
$ aws comprehend detect-entities \ > --endpoint-arn arn \ > --language-code en \ > --text "Andy Jassy is the CEO of Amazon."

如果您的命令成功,Amazon Comprehend 會回應分析。對於 Amazon Comprehend 偵測到的每個實體,它都會提供實體類型、文字、位置和可信度分數。

偵測半結構化文件中的實體 AWS CLI

若要偵測 PDF、Word 或影像檔案中的自訂實體,請使用bytes參數中的輸入檔案執行detect-entities指令。

範例 :使用 CLI 偵測影像檔中的實體

這個例子演示了如何使用 base64 對圖像字節進行編碼的fileb選項傳遞圖像文件。若要取得更多資訊,請參閱《AWS Command Line Interface使用指南》中的二進位大型物件

此範例也會傳入名為的 JSON 檔案,config.json以設定文字擷取選項。

$ aws comprehend detect-entities \ > --endpoint-arn arn \ > --language-code en \ > --bytes fileb://image1.jpg \ > --document-reader-config file://config.json

config.json 檔案包含下列內容。

{ "DocumentReadMode": "FORCE_DOCUMENT_READ_ACTION", "DocumentReadAction": "TEXTRACT_DETECT_DOCUMENT_TEXT" }

如需有關命令語法的詳細資訊,請參閱 Amazon Comprehend API 參考DetectEntities中的。