事件 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

事件

使用事件偵測來分析文字文件,找出特定類型的事件及其相關實體。Amazon Comprehend 使用非同步分析任務,支援跨大型文件集合的事件偵測。如需事件的詳細資訊 (包括事件分析工作範例),請參閱宣布推出 Amazon Comprehend 事件

實體

Amazon Comprehend 會從輸入文字中擷取與偵測到的事件相關的實體清單。實體可以是真實世界的物件,例如人物、地點或位置;實體也可以是概念,例如度量、日期或數量。實體的每個出現次數都會以提及來識別,該提及是對輸入文字中實體的文字參照。對於每個唯一實體,所有提及都會分組到一個清單中。此清單提供輸入文字中實體出現的每個位置的詳細資訊。Amazon Comprehend 只會偵測與支援的事件類型相關聯的實體。

與支援的事件類型相關聯的每個實體都會傳回下列相關詳細資訊:

  • 提及:輸入文字中每次出現相同實體的詳細資料。

    • BeginOffset: 輸入文字中的字元偏移量,顯示提及的開始位置 (第一個字元位於 0 的位置)。

    • EndOffset: 輸入文字中的字元偏移量,顯示提及結束位置。

    • 分數:Amazon Comprehend 對實體類型精確度的信心程度。

    • GroupScore:Amazon Comprehend 認為提及已正確分組與相同實體的其他提及項目的信心程度。

    • 文字:實體的文字。

    • 類型:實體的類型。如需所有支援的實體類型,請參閱圖元類型

事件

Amazon Comprehend 會傳回在輸入文字中偵測到的事件 (受支援的事件類型) 清單。每個事件都會傳回下列相關詳細資訊:

  • 類型:事件的類型。如需所有支援的事件類型,請參閱事件類型

  • 引數:與偵測到的事件相關的引數清單。引由與偵測到的事件相關的實體所組成。參數的角色描述了這種關係,例如做了什麼何地。

    • EntityIndex:可從 Amazon Comprehend 針對此分析傳回的實體清單中識別實體的索引值。

    • 角色:引數類型,說明此引數的實體與事件的關係。如需所有支援的引數類型,請參閱引數類型

    • 得分:Amazon Comprehend 對角色偵測準確性的信心程度。

  • 觸發器:偵測到事件的觸發器清單。觸發器是指示事件發生的單個字或片語。

    • BeginOffset: 輸入文字中的字元偏移量,顯示觸發器的開始位置 (第一個字元位於 0 位置)。

    • EndOffset: 輸入文字中的字元偏移量,顯示觸發器結束位置。

    • 得分:Amazon Comprehend 對偵測準確性的信心程度。

    • 文字:觸發程式的文字。

    • GroupScore:Amazon Comprehend 認為觸發器已正確地與相同事件的其他觸發器分組的信賴程度。

    • 類型:此觸發程式所指示的事件類型。

偵測事件結果格式

事件偵測任務完成後,Amazon Comprehend 會將分析結果寫入您在開始任務時指定的 Amazon S3 輸出位置。

對於每個偵測到的事件,輸出會以下列格式提供詳細資訊:

{ "Entities": [ { "Mentions": [ { "BeginOffset": number, "EndOffset": number, "Score": number, "GroupScore": number, "Text": "string", "Type": "string" }, ... ] }, ... ], "Events": [ { "Type": "string", "Arguments": [ { "EntityIndex": number, "Role": "string", "Score": number }, ... ], "Triggers": [ { "BeginOffset": number, "EndOffset": number, "Score": number, "Text": "string", "GroupScore": number, "Type": "string" }, ... ] }, ... ] }

實體、事件和引數的支援類型

圖元類型

Type 描述
DATE 對日期或時間的任何引用,無論是特定的還是一般。
設施 建築物、機場、公路、橋樑和其他永久性人造結構和房地產改善工程。
LOCATION 物理位置,例如街道,城市,州,國家,水體或地理坐標。
貨幣價值 美國或其他貨幣的價值。該值可以是特定的或近似值。
組織 公司和一個建立的組織結構定義的人的其他群體。
個人或虛構角色的姓名或暱稱。
人物標題 描述一個人的任何職稱,通常是僱傭類別(例如 CEO)或尊敬的(例如 Mr.)。
數量 一個數字或數值以及測量單位。
股票代碼 股票代碼,例如 AMZN、國際證券識別號碼 (ISIN)、統一證券識別程序委員會 (CUMIP) 或證券交易所每日正式名單 (SEDOL)。

事件類型

Type 描述
破產 涉及無法償還未償還債務的人士或公司的法律程序。
就業 當僱員被僱用,解僱,退休,或以其他方式改變就業狀態時發生。
企業收購 當一家公司獲得另一家公司的大部分或全部股份或實物資產的擁有以獲得該公司的控制權時發生。
一般投資 當個人或公司購買具有 future 收入或升值的前景的資產時發生。
企業合併 當兩個或兩個以上的公司團結創建一個新的法律實體時發生。
IPO 私人公司在新股發行中向公眾發行的股份的首次公開發行(IPO)。
權利問題 向現有股東提供一組權利,以按其現有持有的比例購買額外股票(稱為認購權證)。
次要提供項目 公司股東的要約證券。
擱置提供 一項證券交易委員會 (SEC) 條款,允許發行人在一段時間內註冊新發行的證券並出售部分發行品,而無需重新註冊證券或遭受罰款。也稱為貨架登記。
招標提供 購買公司部分或全部股東股份的要約。
股票 _ 分割 當公司的董事會通過向當前股東發行更多股份來增加已發行的股份數量時發生。此事件也適用於反向股票分割。

引數類型

破產的論據類型
引數類型 描述
文件管理員 申請破產的人士或公司。
DATE 破產的日期或時間。
地方 破產發生(或最接近的地方)的地點或設施。
雇用的引數類型
Type 描述
僱員 受僱於公司的人。
員工職稱 員工的職稱。
雇主 僱用該僱員的個人或公司。
START_DATE 僱用的開始日期或時間。
結束日期 僱用的結束日期或時間。
企業的論據類型 _ 收購、投資 _ 一般
Type 描述
與交易相關的貨幣價值。
被投資者 與投資有關的人士或公司。
投資者 投資資產的個人或公司。
DATE 收購或投資的日期或時間。
地方 收購或投資發生的地點(或最接近的地方)。
公司合併的引數類型
Type 描述
DATE 合併的日期或時間。
新公司 合併產生的新法人實體。
參與者 涉及合併的公司。
IPO、權利問題、次要提供項目、擱置提供項目、招標提供的引數類型
Type 描述
到期日 提供項目的到期日或時間。
投資者 投資資產的個人或公司。
受要約人 接受發售的人士或公司。
提供金額 與提供項目相關的貨幣價值。
提供日期 提供項目的日期或時間。
要約人 發起提供的人或公司。
要約者總價值 與提供項目相關的總貨幣價值。
記錄日期 提供項目的記錄日期或時間。
銷售代理 促進銷售該項要約的人士或公司。
股價 與股價相關的貨幣價值。
分享數量 與發行項目相關的股份數目。
承銷商 與發行的承銷有關的公司。
股票 _ 分割的引數類型
Type 描述
公司 該公司發行股票拆分的股份。
DATE 股票分割的日期或時間。
分割比 在股票分割前增加新的流通股數量與當前股份數量的比率。