检测实体(版本 2) - Amazon Comprehend Medical

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

检测实体(版本 2)

使用 DetectEntitiesV2 检测单个文件中的实体,或者使用 StartEntitiesDetectionV2Job 对多个文件进行批量分析。您可以检测以下类别的实体:

  • ANATOMY: 检测对身体部位或身体系统以及这些部位或系统的位置的表述。

  • BEHAVIORAL_ENVIRONMENTAL_SOCIAL:检测环境中影响个人健康的行为和状况。其中包括吸烟、饮酒、吸毒、过敏、性别和种族/民族。

  • MEDICAL_CONDITION: 检测医学状况的体征、症状和诊断。

  • MEDICATION: 检测患者的药物和剂量信息。

  • PROTECTED_HEALTH_INFORMATION: 检测患者的个人信息。

  • TEST_TREATMENT_PROCEDURE: 检测用于确定医学状况的程序。

  • TIME_EXPRESSION: 检测与检测到的实体关联的时间实体。

DetectEntitiesV2 操作可以检测到所有六个类别。要进行 PHI 检测方面的分析,请对单个文件使用 DetectPHI,并使用 StartPHIDetectionJob 进行批量分析。

Amazon Comprehend Medical 可以检测以下类别的信息:

  • 实体:对人员、治疗方法、药物和医学状况等相关对象名称的文字表述。例如 ibuprofen

  • 类别:实体所属的广义分类。例如,布洛芬属于 MEDICATION 类别。

  • 类型:检测到的实体在单个类别中的类型。例如,布洛芬属于 MEDICATION 类别的 GENERIC_NAME 类型。

  • 属性:与实体相关的信息,例如药物剂量。例如,200 mg 是布洛芬实体的属性。

  • 特征:Amazon Comprehend Medical 根据背景信息对实体的了解。例如,如果患者未服用某种药物,则该药物具有 NEGATION 特征。

  • 关系类型:实体与属性之间的关系。

Amazon Comprehend Medical 会为您提供实体在输入文本中的位置。在 Amazon Comprehend 控制台中,位置以图形方式显示。当您使用 API 时,它会通过数值偏移来显示位置。

每个实体和属性都包含一个得分,用来表明 Amazon Comprehend Medical 对检测准确性的置信度。每个属性也有一个关系分数。该得分可以表明 Amazon Comprehend Medical 对该属性与其父实体之间关系的准确性的置信度。请针对您的使用场景确定适当的置信度阈值。需要高准确性时,请使用高置信度阈值。筛选出不符合阈值的数据。

解剖学类别

ANATOMY 类别可以检测对身体部位或身体系统以及这些部位或系统的位置的表述。

类型

  • SYSTEM_ORGAN_SITE:身体系统、解剖学位置或区域以及身体部位。

属性

  • DIRECTION:方位词。例如左、右、内侧、外侧、上、下、后、前、远端、近端、对侧、双侧、同侧、背侧、腹侧等。

行为、环境和社会健康类别

BEHAVIORAL_ENVIRONMENTAL_SOCIAL 类别可以检测对环境中影响个人健康的行为和状况的表述。

类型

  • ALCOHOL_CONSUMPTION:用使用状态、频率、数量和持续时间来说明患者的饮酒量。

  • ALLERGIES:定义患者的过敏和对过敏原的反应。

  • GENDER:表明性别认同。

  • RACE_ETHNICITY: 表明患者所属的特定种族和族裔群体。

  • REC_DRUG_USE:用使用状态、频率、数量和持续时间来说明患者的吸毒量。

  • TOBACCO_USE:用使用状态、频率、数量和持续时间来说明患者的吸烟量。

检测到的以下属性仅适用于 ALCOHOL_CONSUMPTIONTOBACCO_USEREC_DRUG_USE

  • AMOUNT:酒精、烟草或毒品的使用量。

  • DURATION:酒精、烟草或毒品的使用时间。

  • FREQUENCY:酒精、烟草或毒品的使用频率。

特征

检测到的以下特征仅适用于 ALCOHOL_CONSUMPTIONALLERGIESTOBACCO_USEREC_DRUG_USE

  • NEGATION:表明结果为阴性或行动未执行。

  • PAST_HISTORY:表明酒精、烟草或毒品的使用来自患者的过去(现在之前)。

医学状况类别

MEDICAL_CONDITION 类别可以检测医学状况的体征、症状和诊断。该类别具有一种实体类型、四个属性和四个特征。一个或多个特征可以与一个类型关联。有关属性的背景信息及其与诊断的关系会通过 RELATIONSHIP_EXTRACTION. 被检测到并映射到 DX_NAME。例如,从文本“左腿慢性疼痛”中,“慢性”会被检测为属性 ACUITY,“左”会被检测为属性 DIRECTION,“腿”会被检测为属性 SYSTEM_ORGAN_SITE。这些属性的关系会被映射到医学状况实体“疼痛”,并附带一个置信度得分。

类型

  • DX_NAME:列出的所有医学状况。DX_NAME 类型包括目前的疾病、就诊原因和病史。

属性

  • ACUITY:确定疾病的猛烈程度,例如慢性、急性、突发性、持续性或渐进性。

  • DIRECTION:方位词。例如左、右、内侧、外侧、上、下、后、前、远端、近端、对侧、双侧、同侧、背侧或腹侧。

  • SYSTEM_ORGAN_SITE:解剖学位置。

  • QUALITY:医学状况的任何描述词语,例如阶段或等级。

特征

  • DIAGNOSIS:被确定为症状的原因或结果的医学状况。症状可以通过体检结果、实验室或放射学报告或任何其他方式发现。

  • HYPOTHETICAL:表明医学状况是一种假设。

  • LOW_CONFIDENCE:表明医学状况具有高度不确定性。这与提供的置信度分数没有直接关系。

  • NEGATION:表明结果为阴性或行动未执行。

  • PERTAINS_TO_FAMILY:表明医学状况与患者家属有关,与患者无关。

  • SIGN:医生报告的医学状况。

  • SYMPTOM:患者报告的医学状况。

药物类别

MEDICATION 类别可以检测患者的药物和剂量信息。一个或多个属性可以应用于一个类型。

类型

  • BRAND_NAME:药物或治疗剂的受版权保护的品牌名称。

  • GENERIC_NAME:药物或治疗剂的非品牌名称、成分名称或配方混合物。

属性

  • DOSAGE:医嘱用药量。

  • DURATION:用药持续时间。

  • FORM:药物的形式。

  • FREQUENCY:用药频率。

  • RATE:用药速度(主要针对药物输注或静脉注射)。

  • ROUTE_OR_MODE:药物的用药方法。

  • STRENGTH:药物强度。

特征

  • NEGATION:表明患者没有用药。

  • PAST_HISTORY:表明检测到的药物来自患者的过去(现在之前)。

受保护健康信息类别

PROTECTED_HEALTH_INFORMATION 类别可以检测患者的个人信息。要详细了解这一操作,请参阅检测 PHI

类型

  • ADDRESS:任何机构、单位或机构内的病房的地址的所有地理细分信息。

  • AGE:提及的所有年龄信息、年龄范围或任何年龄。其中包括患者、家庭成员或其他人的信息。除非另有说明,否则默认单位为岁。

  • EMAIL:任何电子邮件地址。

  • ID:社会保障号码、病历号、机构识别号、临床试验号、证书或执照号、车辆或设备号、护理地点或提供者。其中还包括患者的任何生物识别数字,例如身高、体重或实验室数值。

  • NAME:所有姓名。通常是患者、家属或提供者的姓名。

  • PHONE_OR_FAX:任何电话、传真或寻呼机号码。不包括指定电话号码,例如 1-800-QUIT-NOW 和 911。

  • PROFESSION:与患者或患者家属有关的任何职业或雇主。其中不包括记录中提及的临床医生的职业。

检查、治疗和手术类别

TEST_TREATMENT_PROCEDURE 类别可以检测用于确定医学状况的程序。一个或多个属性可以与 TEST_NAME 类型的实体相关。

类型

  • PROCEDURE_NAME:对患者进行的一次性干预措施,用于治疗疾病或为患者提供护理。

  • TEST_NAME:对患者执行的诊断、测量、筛查或评级程序,最后可能产生结果数值。其中包括用于确定诊断、排除或确定病情或对患者进行评级或打分的任何程序、流程、评估或评分。

  • TREATMENT_NAME:在一段时间内为对抗疾病或失调而采取的干预措施。其中包括药物,例如抗病毒药物和疫苗接种。

属性

  • TEST_VALUE:检查结果。仅适用于 TEST_NAME 实体类型。

  • TEST_UNIT:检查结果数值可能采用的计量单位。仅适用于 TEST_NAME 实体类型。

特征

  • FUTURE:表明检查、治疗或手术是将在临床记录中的主题事件之后发生的行动或事件。

  • HYPOTHETICAL:表明检查、治疗或手术是一种假设。

  • NEGATION:表明结果为阴性或行动未执行。

  • PAST_HISTORY:表明检查、治疗或手术来自患者的过去(现在之前)。

时间类别

TIME_EXPRESSION 类别可以检测与时间相关的实体。其中包括日期和时间等实体,例如 “三天前”、“今天”、“当前”、“入院当天”、“上个月”或“16 天”。此类别中的结果仅在与实体关联时才会返回。例如,“患者昨天服用了 200 毫克布洛芬”会将 Yesterday 作为与 GENERIC_NAME 实体“布洛芬”重叠的 TIME_EXPRESSION 实体返回。但是,在“患者昨天遛过狗”中,“昨天”不会被认定为一个实体。

类型

  • TIME_TO_MEDICATION_NAME:服药的日期。此类型的特定属性为 BRAND_NAMEGENERIC_NAME

  • TIME_TO_DX_NAME:医学状况的发生日期。此类型的属性为 DX_NAME

  • TIME_TO_TEST_NAME:接受检查的日期。此类型的属性为 TEST_NAME

  • TIME_TO_PROCEDURE_NAME:实施手术的日期。此类型的属性为 PROCEDURE_NAME

  • TIME_TO_TREATMENT_NAME:进行治疗的日期。此类型的属性为 TREATMENT_NAME

关系类型

  • 实体与属性之间的关系。识别出的 Relationship_type 如下:

    OverlapTIME_EXPRESSION 与检测到的实体一致。