事件 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

事件

使用事件检测分析特定类型的事件及其相关实体的文本文档。Amazon Comprehend 支持使用异步分析作业对大量文档集合进行事件检测。有关事件的更多信息,包括事件分析作业示例,请参阅宣布推出Amazon Comprehend 活动

实体

Amazon Comprehend 从输入文本中提取与检测到的事件相关的实体列表。网络 ACL 和安全组都允许 (因此可到达您的实例) 的发起 ping 的实体可以是真实世界的对象,例如人、地点或位置;实体也可以是概念,例如度量、日期或数量。实体的每一次出现均由一个提到,它是对输入文本中实体的文本引用。对于每个唯一的实体,所有提及都会分组到一个列表中。此列表提供了输入文本中实体所在的每个位置的详细信息。Amazon Comprehend 仅检测与支持的事件类型关联的实体。

与支持的事件类型关联的每个实体都会返回以下相关详细信息:

  • 提及:输入文本中每次出现相同实体的详细信息。

    • BeginOffset:输入文本中的字符偏移量,显示提及的起始位置(第一个字符位于位置 0)。

    • EndOffset:输入文本中显示提及结束位置的字符偏移量。

    • 得分:Amazon Comprehend 对实体类型的准确性的置信度。

    • GroupScore:Amazon Comprehend 对提及与同一实体的其他提及正确分组的信心程度。

    • Text:实体的文本。

    • 类型:实体的类型。有关所有受支持的实体类型,请参阅实体类型.

事件

Amazon Comprehend 返回它在输入文本中检测到的事件(受支持的事件类型)列表。每个事件都会返回以下相关详细信息:

  • 类型:事件的类型。有关受支持的所有事件类型,请参阅事件类型.

  • Arguments (参数):与检测到的事件关联的参数的列表。网络 ACL 和安全组都允许 (因此可到达您的实例) 的发起 ping 的争论由与检测到的事件相关的实体组成。参数的角色描述了这种关系,例如做到了什么哪里什么时候.

    • EntityIndex:从 Amazon Comprehend 为此分析返回的实体列表中标识实体的索引值。

    • 角色:参数类型,描述此参数的实体与事件的关系。有关所有支持的参数类型,请参阅参数类型.

    • 得分:Amazon Comprehend 对角色检测准确性的置信度。

  • 触发器:检测到的事件的触发器列表。一个触发是表示事件发生的词或短语。

    • BeginOffset:输入文本中的字符偏移量,显示触发器的起始位置(第一个字符位于位置 0)。

    • EndOffset:输入文本中显示触发器结束位置的字符偏移量。

    • 得分:亚马逊理解 (Amazon Comprehend) 对检测准确性的置信度。

    • Text:触发器的文本。

    • GroupScore:Amazon Comprehend 的置信度,即该触发器与同一事件的其他触发器正确分组。

    • 类型:此触发器指示的事件类型。

检测事件结果格式

事件检测任务完成后,Amazon Comprehend 会将分析结果写入您在启动该任务时指定的 Amazon S3 输出位置。

对于检测到的每个事件,输出均采用以下格式提供详细信息:

{ "Entities": [ { "Mentions": [ { "BeginOffset": number, "EndOffset": number, "Score": number, "GroupScore": number, "Text": "string", "Type": "string" }, ... ] }, ... ], "Events": [ { "Type": "string", "Arguments": [ { "EntityIndex": number, "Role": "string", "Score": number }, ... ], "Triggers": [ { "BeginOffset": number, "EndOffset": number, "Score": number, "Text": "string", "GroupScore": number, "Type": "string" }, ... ] }, ... ] }

支持的实体、事件和参数类型

实体类型

类型 说明
DATE 对日期或时间的任何引用,无论是具体的还是一般的。
设施 建筑、机场、高速公路、桥梁和其他永久性人造结构和房地产改善。
LOCATION 物理位置,例如街道、城市、州、国家、水域或地理坐标。
MONETARY_VALU 以美元或其他货币表示的某物的价值。该值可以是特定值或近似值。
组织 由既定组织结构定义的公司和其他人群。
个人或虚构人物的姓名或昵称。
人物头衔 描述个人的任何头衔,通常是雇佣类别(例如首席执行官)或尊敬的(例如先生)。
数量 数字或值以及计量单位。
STOCK_CODE 股票代码,例如AMZN、国际证券识别号(ISIN)、统一证券识别程序委员会(CUSIP)或证券交易所每日官方名单(SEDOL)。

事件类型

类型 描述
破产 涉及无法偿还未偿债务的个人或公司的法律诉讼。
雇用 当员工被雇用、解雇、退休或以其他方式改变雇佣状态时发生。
CORPORATE_ACQUISTION 当一家公司获得另一家公司的大部分或全部股份或实物资产的占有权以获得对该公司的控制权时发生。
投资一般 当个人或公司购买有望产生future 收入或升值的资产时发生。
企业合并 当两家或多家公司联合起来创建新的法人实体时发生。
IPO 以新股票发行方式向公众首次公开发行(IPO)私营公司的股票。
权利_问题 向现有股东提供的一组按其现有持股比例购买额外股票的权利,称为认购权证。
SECONDARY_OFFER 公司股东要约证券。
SHELF_OFFERING 美国证券交易委员会(SEC)的一项条款,允许发行人在一段时间内注册新发行的证券并出售部分发行的证券,而无需重新注册证券或受到处罚。也称作货架登记。
招标发售 收购公司部分或全部股东股份的要约。
STOCK_SPLIT 当公司董事会通过向现有股东发行更多股票来增加已发行股票数量时发生。此事件也适用于反向股票分割。

参数类型

破产的参数类型
参数类型 描述
申报人 申请破产的个人或公司。
DATE 破产的日期或时间。
地方 破产发生地(或最接近地点)的地点或设施。
就业的参数类型
类型 描述
雇员 公司雇用的人员。
员工职称 员工的头衔。
雇主 雇用该员工的个人或公司。
END_DATE 雇佣的开始日期或时间。
START_DATE 雇佣的结束日期或时间。
CORPORATE_ACQUISTION、投资_GENERAL 的参数类型
类型 描述
金额 与交易关联的货币价值。
被投资者 与投资相关的个人或公司。
投资者 投资资产的个人或公司。
DATE 收购或投资的日期或时间。
地方 收购或投资发生地(或最接近地点)的地点。
CORPORATE_MERGER 的参数类型
类型 说明
DATE 合并的日期或时间。
新公司 合并产生的新法人实体。
参与者 参与合并的公司。
IPO、RIGHTS_ISSUE、二次发售、SHELF_OFFERING、TENDER_OFFERING 的参数类型
类型 描述
EXPIRE_DATE 发行的到期日期或时间。
投资者 投资资产的个人或公司。
被要约人 接受要约的个人或公司。
提供金额 与发行关联的货币价值。
OFFERING_DATE 发售的日期或时间。
要约人 发起发行的个人或公司。
OFFER_TOTAL_VALUE 与产品关联的总货币价值。
记录日期 发行的记录日期或时间。
SELLING_AGENT 为销售提供便利的个人或公司。
分享价格 与股价相关的货币价值。
分享数量 与发行相关的股票数量。
承销商 与本次发行的承保相关的公司。
STOCK_SPLIT 的参数类型
类型 描述
公司 发行股票拆分的公司。
DATE 股票分割的日期或时间。
SPLIT_RATIO 股票拆分前增加的新发行股票数量与当前股票数量的比率。