エンティティの検出 - Amazon Comprehend

「翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。」

エンティティの検出

DetectEntitiesドキュメントのエンティティを検出するにはBatchDetectEntities、、、および StartEntitiesDetectionJob オペレーションを使用します。エンティティは、人物、場所、商用アイテムなどの実際のオブジェクトの一意の名前、および日付や量などのメジャーの正確な参照に対するテキストによる参照です。

たとえば、「John moved to 1313 Mockingbird Lane in 2012」というテキストでは、「John」は として認識されPERSON、「1313 Mockingbird Lane」は として認識LOCATIONされ、「2012」は として認識される可能性がありますDATE

各エンティティには、エンティティタイプを正しく検出したことを Amazon Comprehend が持っている信頼度を示すスコアもあります。スコアが低いエンティティを除外して、誤った検出を使用するリスクを軽減できます。

次の表に、エンティティタイプを示します。

タイプ 説明

COMMERCIAL_ITEM

マーク付き製品

DATE

完全な日付 (例: 11/25/2017日 (火曜日)、月 (5 月)、または時間 (8:30 a.m.)

EVENT

フェデレーション、コンサート、選択などのイベント。

LOCATION

国、市、湖、建物などの特定の場所。

組織

政府、企業、団体、スポーツチームなどの大規模な組織。

OTHER

他のどのエンティティカテゴリにも適合しないエンティティ

個人

個人、人物のグループ、ニックネーム、架空のキャラクター

数量

通貨、割合、数値、バイトなどの量に換算した値。

TITLE

映画、書籍、曲など、クリエイティブまたはクリエイティブ作品に付けられた正式な名前。

エンティティの検出オペレーションは Amazon Comprehend でサポートされている任意のプライマリ言語を使用して実行できます。これには、事前定義された (カスタムではない) エンティティ検出のみが含まれます。すべてのドキュメントは同じ言語である必要があります。

以下のいずれかのオペレーションを使用して、ドキュメントまたはドキュメントのセット内のエンティティを検出できます。

オペレーションは、ドキュメント内のエンティティごとに 1 つずつ、 Entity オブジェクトのリストを返します。BatchDetectEntities オペレーションは、 Entity オブジェクトのリストを返します。このリストは、バッチ内の各ドキュメントに対して 1 つずつ返されます。StartEntitiesDetectionJob オペレーションは非同期ジョブを開始し、ジョブ内の各ドキュメントのEntityオブジェクトのリストを含むファイルを生成します。

次の例は、 DetectEntities オペレーションからのレスポンスです。

{ "Entities": [ { "Text": "today", "Score": 0.97, "Type": "DATE", "BeginOffset": 14, "EndOffset": 19 }, { "Text": "Seattle", "Score": 0.95, "Type": "LOCATION", "BeginOffset": 23, "EndOffset": 30 } ], "LanguageCode": "en" }