文件處理模式

Amazon Comprehend 支援三種文件處理模式。您選擇的模式取決於您需要處理的文件數量，以及您需要檢視結果的立即程度：

單一文件同步 – 您可以使用單一文件呼叫 Amazon Comprehend，並立即接收同步回應，並傳送到您的應用程式（或主控台）。
多文件同步 – 您呼叫 Amazon Comprehend API，最多可收集 25 個文件，並接收同步回應。
非同步批次 – 對於大量文件集合，請將文件放入 Amazon S3 儲存貯體，並啟動非同步任務（使用主控台或 API 操作）來分析文件。Amazon Comprehend 會將分析結果儲存在您在請求中指定的 S3 儲存貯體/資料夾中。

單一文件處理

單一文件操作是同步操作，可將文件分析的結果直接傳回至您的應用程式。當您建立互動式應用程式時，請使用單一文件同步操作，一次只能處理一個文件。

如需同步 API 操作的詳細資訊，請參閱使用內建模型進行即時分析（適用於主控台）和使用 API 進行即時分析。

多個文件同步處理

當您有多個文件要處理時，您可以使用 Batch* API 操作一次將多個文件傳送至 Amazon Comprehend。每個請求最多可傳送 25 個文件。Amazon Comprehend 會傳回回應清單，每個文件在請求中各傳送一個。使用這些操作提出的請求是同步的。您的應用程式會呼叫操作，然後等待服務的回應。

使用 Batch*操作與呼叫請求中每個文件的單一文件 APIs 相同。使用這些 APIs 可以為您的應用程式帶來更好的效能。

每個 APIs的輸入都是 JSON 結構，其中包含要處理的文件。對於以外的所有操作BatchDetectDominantLanguage，您必須設定輸入語言。每個請求只能設定一種輸入語言。例如，以下是 BatchDetectEntities操作的輸入。它包含兩個文件，並以英文顯示。


{
   "LanguageCode": "en",
   "TextList": [
      "I have been living in Seattle for almost 4 years",
      "It is raining today in Seattle"
   ]
}

Batch* 操作的回應包含兩個清單： ResultList和 ErrorList。對於每個已成功處理的文件， ResultList包含一筆記錄。請求中每個文件的結果與您在文件上執行單一文件操作時所取得的結果相同。每個文件的結果都會根據輸入檔案中文件的順序指派索引。BatchDetectEntities 操作的回應是：


{
   "ResultList"  : [
      {
         "Index": 0,
         "Entities": [
            {
               "Text": "Seattle", 
               "Score": 0.95, 
               "Type": "LOCATION", 
               "BeginOffset": 22, 
               "EndOffset": 29
            },
            {
               "Text": "almost 4 years", 
               "Score": 0.89, 
               "Type": "QUANTITY", 
               "BeginOffset": 34, 
               "EndOffset": 48
            }
         ]
      },
      {
         "Index": 1,
         "Entities": [
            {
              "Text": "today",
              "Score": 0.87,
              "Type": "DATE",
              "BeginOffset": 14,
              "EndOffset": 19
            },
            {
               "Text": "Seattle",
               "Score": 0.96,
               "Type": "LOCATION",
               "BeginOffset": 23,
               "EndOffset": 30
            }
         ]
      }
   ],
   "ErrorList": []
}

當請求中發生錯誤時，回應會包含可識別包含錯誤的文件ErrorList的。文件是透過其在輸入清單中的索引來識別。例如，對 BatchDetectLanguage操作的下列輸入包含無法處理的文件：


{
   "TextList": [
     "hello friend", 
     "$$$$$$",
     "hola amigo"
   ]       
}

Amazon Comprehend 的回應包含錯誤清單，可識別包含錯誤的文件：


{
    "ResultList": [
        {
          "Index": 0,
          "Languages":[
            {
              "LanguageCode":"en",
              "Score": 0.99
            }
          ]
        },
        {
          "Index": 2
          "Languages":[
            {
              "LanguageCode":"es",
              "Score": 0.82
            }
          ]
        }
    ],
    "ErrorList": [
      {
        "Index": 1,
        "ErrorCode": "InternalServerException",
        "ErrorMessage": "Unexpected Server Error. Please try again."
      }
    ]
}

如需同步批次 API 操作的詳細資訊，請參閱即時批次 APIs。

非同步批次處理

若要分析大型文件和大型文件集合，請使用 Amazon Comprehend 非同步操作。

若要分析文件集合，您通常會執行下列步驟：

將文件存放在 Amazon S3 儲存貯體中。
啟動一或多個分析任務以分析文件。
監控分析任務的進度。
任務完成時，從 S3 儲存貯體擷取分析結果。

如需使用非同步 API 操作的詳細資訊，請參閱使用主控台執行分析任務（主控台）和使用 API 的非同步分析任務。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

主題建模

支援的語言