本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
自訂實體辨識 (API) 的即時分析
您可以使用 Amazon Comprehend API 透過自訂模型執行即時分析。首先,您要建立端點來執行即時分析。建立端點之後,即可執行即時分析。
如需佈建端點輸送量及相關成本的相關資訊,請參閱使用 Amazon Comprehend 端點。
建立用於自訂實體偵測的端點
如需與端點相關聯之成本的資訊,請參閱使用 Amazon Comprehend 端點。
建立端點 AWS CLI
若要使用建立端點AWS CLI,請使用以下create-endpoint
指令:
$
aws comprehend create-endpoint \
>
--desired-inference-units
number of inference units
\
>
--endpoint-name
endpoint name
\
>
--model-arn
arn:aws:comprehend:region
:account-id
:model/example
\
>
--tags
Key=Key
,Value=Value
如果您的命令成功,Amazon Comprehend 會使用端點 ARN 回應:
{ "EndpointArn": "
Arn
" }
若要取得有關此指令、其參數引數及其輸出的更多資訊,請參閱《AWS CLI指令參考》create-endpoint
中的〈〉。
執行即時自訂實體偵測
為自訂實體辨識器模型建立端點後,您可以使用端點執行 DetectEntitiesAPI 作業。您可以使用text
或bytes
參數提供文字輸入。使用參數輸入其他輸入類bytes
型。
對於影像檔案和 PDF 檔案,您可以使用DocumentReaderConfig
參數來取代預設文字萃取動作。如需詳細資訊,請參閱 設定文字擷取選項。
使用偵測文字中的圖元 AWS CLI
若要偵測文字中的自訂實體,請使用text
參數中的輸入文字執行detect-entities
指令。
範例 :使用 CLI 偵測輸入文字中的實體
$
aws comprehend detect-entities \
>
--endpoint-arn
arn
\
>
--language-code
en
\
>
--text
"Andy Jassy is the CEO of Amazon.
"
如果您的命令成功,Amazon Comprehend 會回應分析。對於 Amazon Comprehend 偵測到的每個實體,它都會提供實體類型、文字、位置和可信度分數。
偵測半結構化文件中的實體 AWS CLI
若要偵測 PDF、Word 或影像檔案中的自訂實體,請使用bytes
參數中的輸入檔案執行detect-entities
指令。
範例 :使用 CLI 偵測影像檔中的實體
這個例子演示了如何使用 base64 對圖像字節進行編碼的fileb
選項傳遞圖像文件。若要取得更多資訊,請參閱《AWS Command Line Interface使用指南》中的二進位大型物件
此範例也會傳入名為的 JSON 檔案,config.json
以設定文字擷取選項。
$
aws comprehend detect-entities \
>
--endpoint-arn
arn
\
>
--language-code
en
\
>
--bytes
fileb://image1.jpg\
>
--document-reader-config file://config.json
config.json 檔案包含下列內容。
{ "DocumentReadMode": "FORCE_DOCUMENT_READ_ACTION", "DocumentReadAction": "TEXTRACT_DETECT_DOCUMENT_TEXT" }
如需有關命令語法的詳細資訊,請參閱 Amazon Comprehend API 參考DetectEntities中的。