エンティティ - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

エンティティ

エンティティとは、人や場所、あるいは商品などの現実世界のオブジェクトの固有の名前をテキストで表したものであり、日付や数量などの測定値を正確に表すことができます。

たとえば、「John moved to 1313 Mockingbird Lane in 2012」というテキストでは、「John」は PERSON と認識され、「1313 Mockingbird Lane」は LOCATION、「2012」 はDATE と認識されます。

各エンティティには、エンティティタイプが正しく検出されたという Amazon Comprehend の信頼レベルを示すスコアも含まれます。スコアの低いエンティティを除外して、誤検出を使ってしまう行うリスクを減らすことができます。

以下の表はエンティティのタイプをまとめています。

説明

COMMERCIAL_ITEM

ブランド製品

DATE

日付 (11/25/2017 など)、曜日 (Tuesday)、月 (May)、または時刻 (8:30 a.m.)

EVENT

フェスティバル、コンサート、選挙などのイベント

LOCATION

国、都市、湖、建物などの特定の場所

ORGANIZATION

政府、企業、宗教、スポーツチームなどの大規模な組織

OTHER

他のどのエンティティカテゴリにも当てはまらないエンティティ

PERSON

個人、グループ、ニックネーム、架空の人物

QUANTITY

通貨、パーセント、数値、バイト数などの数量。

TITLE

映画、本、歌など、あらゆる作品や創作作品に付けられた正式名称。

エンティティの検出オペレーションは、Amazon Comprehend がサポートする主要言語のいずれかを使用して実行できます。これには、定義済み (カスタムではない) エンティティの検出のみが対象になります。ドキュメントの言語はすべて同じである必要があります。

次の API オペレーションのいずれかを使用して、ドキュメントまたはドキュメントセット内のエンティティを検出できます。

これらのオペレーションは、ドキュメント内のエンティティごとに 1 つの割合で、API エンティティオブジェクトのリストを返します。BatchDetectEntities オペレーションは、バッチ内のドキュメントごとに 1 つのリストの割合で Entity オブジェクトのリストを返します。StartEntitiesDetectionJob オペレーションは、ジョブ内のドキュメントごとに Entity オブジェクトのリスト 1 つを含むファイルを生成する非同期ジョブを開始します。

以下は、DetectEntities オペレーションからのレスポンスの例です。

{ "Entities": [ { "Text": "today", "Score": 0.97, "Type": "DATE", "BeginOffset": 14, "EndOffset": 19 }, { "Text": "Seattle", "Score": 0.95, "Type": "LOCATION", "BeginOffset": 23, "EndOffset": 30 } ], "LanguageCode": "en" }