实体 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

实体

网络 ACL 和安全组都允许 (因此可到达您的实例) 的发起 ping 的实体是对真实世界对象(如人物、地点和商业物品)的唯一名称的文本引用,以及对诸如日期和数量之类的度量的精确引用。

例如,在文本 “约翰在 2012 年搬到知更鸟巷 1313 号” 中,“约翰” 可能被识别为PERSON,“1313 知更鸟巷” 可能会被识别为LOCATION,而 “2012” 可能会被识别为DATE.

每个实体还有一个分数,指示 Amazon Comprehend 对其正确检测到实体类型的信心程度。您可以筛选出分数较低的实体,以降低使用错误检测的风险。

下表列出了实体类型。

类型 描述

商业物品

品牌商品

DATE

完整日期(例如,2017 年 11 月 25 日)、日(星期二)、月(5 月)或时间(上午 8:30)

EVENT

节日、音乐会、选举等活动。

LOCATION

特定位置,例如国家、城市、湖泊、建筑物等。

组织

大型组织,例如政府、公司、宗教、运动队等。

OTHER

不适合任何其他实体类别

个人、群体、昵称、虚构人物

数量

量化的金额,例如货币、百分比、数字、字节等。

TITLE

任何创作或创意作品的正式名称,例如电影、书籍、歌曲等。

检测实体操作可使用 Amazon Comprehend 支持的任何一种主要语言来执行。这仅包括预定义(非自定义)实体检测。所有文档必须使用相同的语言。

您可以使用以下任何 API 操作来检测文档或文档集中的实体。

操作返回一组Entity对象,文档中的每个实体对应一个。这些区域有:BatchDetectEntities操作返回一组Entity对象,批中的每个文档都有一个列表。这些区域有:StartEntitiesDetectionJob操作启动一个异步作业,该作业生成一个文件,其中包含Entity作业中每个文档的对象。

以下示例来自响应DetectEntitiesoperation.

{ "Entities": [ { "Text": "today", "Score": 0.97, "Type": "DATE", "BeginOffset": 14, "EndOffset": 19 }, { "Text": "Seattle", "Score": 0.95, "Type": "LOCATION", "BeginOffset": 23, "EndOffset": 30 } ], "LanguageCode": "en" }