엔터티 탐지 - Amazon Comprehend Medical

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

엔터티 탐지

참고

새 애플리케이션에는 이 버전의 DetectEntities 작업을 사용하지 마십시오. 대신, 작업 버전 2를 사용하십시오. 모든 새로운 반복 및 기능 개선 사항은 DetectEntitiesV2에만 적용됩니다. 자세한 내용은 Detect entities(버전 2) 섹션을 참조하세요.

DetectEntities 작업을 사용하여 텍스트에서 의료 엔터티를 탐지할 수 있습니다. 다음과 같은 범주의 엔터티를 탐지합니다.

  • ANATOMY

  • MEDICAL_CONDITION

  • MEDICATION

  • PROTECTED_HEALTH_INFORMATION

  • TEST_TREATMENT_PROCEDURE

다섯 가지 범주가 모두 DetectEntities 작업에 의해 탐지됩니다. DetectPHI 작업은 PROTECTED_HEALTH_INFORMATION 범주의 엔터티만 탐지합니다. 보호 대상 건강 정보(PHI)가 필요한 경우에만 사용합니다. 이 작업에 대한 내용은 PII 탐지 단원을 참조하십시오.

Amazon Comprehend Medical은 다음과 같은 클래스의 정보를 탐지합니다.

  • 엔터티: 사람, 치료법, 약품, 의학적 상태 등 관련 객체의 이름에 대한 텍스트 참조. 예: “이부프로펜”

  • 범주: 탐지된 엔터티가 속하는 일반화된 그룹입니다. 예를 들어, “이부프로펜”은 MEDICATION 범주에 속합니다.

  • 유형: 탐지된 엔터티의 유형으로, 범위가 한 범주로 지정됩니다. 예를 들어, “이부프로펜”은 MEDICATION 범주의 GENERIC_NAME 유형에 속합니다.

  • 속성: 탐지된 엔터티와 관련된 정보(예: 약물 투여량). 예를 들어, "200mg"은 “이부프로펜” 엔터티의 속성입니다.

  • 특성: Amazon Comprehend Medical이 컨텍스트를 기반으로 엔터티에 대해 이해하는 내용. 예를 들어, 환자가 복용하지 않는 의약품에는 NEGATION 특성이 있습니다.

Amazon Comprehend Medical은 입력 텍스트에서 엔터티의 위치를 제공합니다. Amazon Comprehend 콘솔에서는 위치를 그래픽으로 보여줍니다. API를 사용하면 위치가 숫자 오프셋으로 표시됩니다.

각 엔터티 및 속성에는 Amazon Comprehend Medical의 탐지 정확도에 대한 신뢰 수준을 나타내는 점수가 포함되어 있습니다. 각 속성에는 관계 점수도 있습니다. 이 점수는 Amazon Comprehend Medical이 속성과 상위 엔터티 간의 관계 정확성에 해당하는 신뢰 수준을 나타냅니다. 사용 사례에 적합한 신뢰 임계값을 식별합니다. 높은 정확도가 필요한 상황에서는 높은 신뢰도 임계값을 사용하고 임계값을 충족하지 않는 데이터는 걸러냅니다.

해부학 범주

ANATOMY 범주는 신체 또는 신체 계통의 일부 및 해당 부위나 계통의 위치에 대한 레퍼런스를 탐지합니다. 여기에는 다음 두 가지 엔터티 유형이 포함됩니다.

유형

  • DIRECTION: 지침 용어. 예: 왼쪽, 오른쪽, 내측, 외측, 상부, 하부, 후방, 전방, 원위부, 근위부, 반대측, 양측, 동측, 등쪽, 복부 등.

  • SYSTEM_ORGAN_SITE: 신체 계통, 해부학적 위치 또는 부위, 신체 부위.

“환자의 왼쪽 폐”라는 텍스트는 다음을 반환합니다.

  • “왼쪽”은 DIRECTION 유형입니다.

  • “폐”는 SYSTEM_ORGAN_SITE 유형입니다.

DetectEntities 작업은 다음 JSON 구조를 반환합니다.

{ "Entities": [ { "Id": 0, "BeginOffset": 10, "EndOffset": 14, "Score": 0.9876197576522827, "Text": "left", "Category": "ANATOMY", "Type": "DIRECTION", "Traits": [] }, { "Id": 1, "BeginOffset": 15, "EndOffset": 19, "Score": 0.9820258021354675, "Text": "lung", "Category": "ANATOMY", "Type": "SYSTEM_ORGAN_SITE", "Traits": [] } ], "UnmappedAttributes": [] }

의학적 상태 범주

MEDICAL_CONDITION 범주는 의학적 상태의 증상 및 진단을 탐지합니다. 여기에는 두 가지 엔터티 유형과 일곱 가지 특성이 포함됩니다. 하나 이상의 특성을 한 가지 유형과 연결할 수 있습니다.

유형

  • ACUITY: 만성, 급성, 돌발성, 지속성 또는 점진적 등 질병 사례 결정.

  • DX_NAME: 모든 의학적 상태가 나열되어 있습니다. DX_NAME 유형에는 현재 질병, 방문 이유, 병력이 포함됩니다.

속성

  • QUALITY: 병기 또는 등급과 같은 의학적 상태를 설명하는 모든 용어.

특성

  • DIAGNOSIS: 증상의 평가에 의해 결정되는 의학적 상태의 식별. 이 평가는 신체 소견, 실험실 또는 방사선 보고서 또는 환자 설명을 바탕으로 합니다. DX_NAME 유형에만 적용됩니다.

  • HYPOTHETICAL: 의학적 상태가 가설로 표현된다는 표시. DX_NAME 유형에만 적용됩니다.

  • LOW_CONFIDENCE: 의학적 상태의 불확실성이 높은 것으로 표현된다는 표시. 제공된 신뢰도 점수와는 직접적인 관련이 없습니다. DX_NAME 유형에만 적용됩니다.

  • NEGATION: 결과 또는 조치가 부정적이거나 수행되지 않고 있다는 표시.

  • PERTAINS_TO_FAMILY: 의학적 상태가 환자 본인이 아닌 환자의 가족과 관련 있다는 표시. DX_NAME 유형에만 적용됩니다.

  • SIGN: 의사가 보고한 의학적 상태. DX_NAME 유형에만 적용됩니다.

  • SYMPTOM: 환자가 보고한 의학적 상태. DX_NAME 유형에만 적용됩니다.

“환자가 4/10의 만성 통증을 앓고 있음"이라는 텍스트는 다음과 같은 내용을 반환합니다.

  • “통증”은 DX_NAME 유형입니다.

  • SYMPTOM은 "통증" 유형특성입니다.

  • “만성”은 ACUITY 유형입니다.

DetectEntities 작업은 다음 JSON 구조를 반환합니다.

{ "Entities": [ { "Id": 0, "BeginOffset": 26, "EndOffset": 33, "Score": 0.9961825013160706, "Text": "chronic", "Category": "MEDICAL_CONDITION", "Type": "ACUITY", "Traits": [] }, { "Id": 1, "BeginOffset": 34, "EndOffset": 45, "Score": 0.8380221724510193, "Text": "aching pain", "Category": "MEDICAL_CONDITION", "Type": "DX_NAME", "Traits": [ { "Name": "SYMPTOM", "Score": 0.6004688739776611 } ] } ], "UnmappedAttributes": [] }

약물 범주

MEDICATION 범주는 환자의 약물 및 투여량 정보를 감지합니다. 여기에는 두 가지 엔터티 유형, 일곱 가지 속성, 한 가지 특성이 포함됩니다. 하나 이상의 속성을 한 가지 유형에 적용할 수 있습니다.

유형

  • BRAND_NAME: 약물 또는 치료제의 저작권이 있는 브랜드 이름.

  • GENERIC_NAME: 약물 또는 치료제의 비브랜드 이름, 성분 이름 또는 포뮬러 혼합물.

속성

  • DOSAGE: 주문한 의약품의 양.

  • DURATION: 약을 투여 기간.

  • FORM: 약물의 형태.

  • FREQUENCY: 약물 투여 빈도.

  • RATE: 약물 투여율(주로 약물 주입 또는 IV에 사용됨).

  • ROUTE_OR_MODE: 약물의 투여 방법.

  • STRENGTH: 투약 강도.

특성

  • NEGATION: 환자가 약물을 투여하고 있지 않다는 모든 징후.

  • PAST_HISTORY: 검출된 약물이 환자의 과거(현재 만남 이전)에서 비롯되었다는 표시.

“염화나트륨 0.9% 용액 1000mL를 매일 정맥 주사 투여량 - 다음 3일 동안 시간당 200mL"라는 텍스트는 다음과 같은 내용을 반환합니다.

  • "주사"는 "염화나트륨" 유형과 관련된 "ROUTE_OR_MODE" 속성입니다.

  • “염화나트륨”은 GENERIC_NAME 유형입니다.

  • "0.9%"는 "염화나트륨" 유형과 관련된 STRENGTH 속성입니다.

  • "용액"은 "염화나트륨" 유형과 관련된 FORM 속성입니다.

  • "100mL"는 "염화나트륨" 유형과 관련된 DOSAGE 속성입니다.

  • "정맥"은 "염화나트륨" 유형과 관련된 ROUTE_OR_MODE 속성입니다.

  • "매일"은 "염화나트륨" 유형과 관련된 FREQUENCY 속성입니다.

  • "시간당 200mL"는 "염화나트륨" 유형과 관련된 RATE 속성입니다.

  • "다음 3일"은 "염화나트륨" 유형과 관련된 DURATION 속성입니다.

DetectEntities 작업은 다음 JSON 구조를 반환합니다.

{ "Entities": [ { "Id": 1, "BeginOffset": 7, "EndOffset": 22, "Score": 0.9998517036437988, "Text": "Sodium Chloride", "Category": "MEDICATION", "Type": "GENERIC_NAME", "Traits": [], "Attributes": [ { "Type": "ROUTE_OR_MODE", "Score": 0.32359644770622253, "RelationshipScore": 0.9719992280006409, "Id": 0, "BeginOffset": 0, "EndOffset": 6, "Text": "Infuse", "Traits": [] }, { "Type": "STRENGTH", "Score": 0.9976715445518494, "RelationshipScore": 0.7892051339149475, "Id": 2, "BeginOffset": 23, "EndOffset": 27, "Text": "0.9%", "Traits": [] }, { "Type": "FORM", "Score": 0.9930835962295532, "RelationshipScore": 0.9956902861595154, "Id": 3, "BeginOffset": 28, "EndOffset": 36, "Text": "solution", "Traits": [] }, { "Type": "ROUTE_OR_MODE", "Score": 0.9990690350532532, "RelationshipScore": 0.9801701903343201, "Id": 5, "BeginOffset": 45, "EndOffset": 58, "Text": "intravenously", "Traits": [] }, { "Type": "FREQUENCY", "Score": 0.9539222121238708, "RelationshipScore": 0.9864235520362854, "Id": 6, "BeginOffset": 59, "EndOffset": 64, "Text": "daily", "Traits": [] }, { "Type": "DURATION", "Score": 0.9392423033714294, "RelationshipScore": 0.9961885809898376, "Id": 8, "BeginOffset": 91, "EndOffset": 97, "Text": "3 days", "Traits": [] } ] } ], "UnmappedAttributes": [ { "Type": "MEDICATION", "Attribute": { "Type": "DOSAGE", "Score": 0.9922149777412415, "Id": 4, "BeginOffset": 37, "EndOffset": 44, "Text": "1000 mL", "Traits": [] } }, { "Type": "MEDICATION", "Attribute": { "Type": "RATE", "Score": 0.9728594422340393, "Id": 7, "BeginOffset": 72, "EndOffset": 81, "Text": "200 mL/hr", "Traits": [] } } ] }

보호 대상 건강 정보 범주

PROTECTED_HEALTH_INFORMATION 범주는 환자의 개인 정보를 탐지합니다. 여기에는 8개의 엔터티 유형이 포함되어 있습니다. PROTECTED_HEALTH_INFORMATION 범주와 해당 범주가 탐지되는 방식에 대한 자세한 내용은 PII 탐지 을 참조하십시오.

유형

  • ADDRESS: 시설, 유명 의료 시설 또는 시설 내 병동 주소의 모든 지리적 세분화.

  • AGE: 연령, 연령 범위 또는 환자 또는 다른 사람의 임상 기록에 언급된 연령의 모든 구성 요소. 달리 명시되지 않는 한 기본값은 연도입니다.

  • EMAIL: 이메일 주소.

  • ID: 환자와 관련된 모든 식별 번호. 여기에는 사회 보장 번호, 의료 기록 번호, 증명서 또는 면허 번호, 차량 또는 디바이스 번호 또는 생체인식 번호 등 환자 고유의 번호가 포함됩니다. 또한 시설 식별 번호, 임상 시험 번호, 진료 장소 또는 제공자도 포함됩니다.

  • DATE: 환자 또는 환자 치료와 관련된 모든 날짜.

  • NAME: 임상 기록에 언급된 모든 이름. 일반적으로 환자, 가족 또는 의료 제공자에게 속한 이름입니다.

  • PHONE_OR_FAX: 전화, 팩스 또는 페이저 번호. 1-800-QUIT-NOW 및 911처럼 이름이 지정된 전화번호는 제외됩니다.

  • PROFESSION: 임상 기록에 언급된 환자 또는 환자 가족과 관련된 직업 또는 고용주 메모에 언급된 임상의의 직업을 의미하지 않습니다.

텍스트 “환자는 워싱턴 주 시애틀에 거주하고 있는 48세의 교사 존 스미스입니다.” 는 다음을 반환합니다.

  • “존 스미스”는 NAME 유형입니다.

  • “48"은 AGE 유형입니다.

  • “교사”는 PROFESSION 유형입니다.

  • “워싱턴 주 시애틀”은 ADDRESS 유형입니다.

DetectEntities 작업은 다음 JSON 구조를 반환합니다.

{ "Entities": [ { "Id": 0, "BeginOffset": 11, "EndOffset": 21, "Score": 0.9967977404594421, "Text": "John Smith", "Category": "PROTECTED_HEALTH_INFORMATION", "Type": "NAME", "Traits": [] }, { "Id": 1, "BeginOffset": 25, "EndOffset": 27, "Score": 0.9998422861099243, "Text": "48", "Category": "PROTECTED_HEALTH_INFORMATION", "Type": "AGE", "Traits": [] }, { "Id": 2, "BeginOffset": 37, "EndOffset": 44, "Score": 0.9079490900039673, "Text": "teacher", "Category": "PROTECTED_HEALTH_INFORMATION", "Type": "PROFESSION", "Traits": [] }, { "Id": 3, "BeginOffset": 61, "EndOffset": 80, "Score": 0.986108124256134, "Text": "Seattle, Washington", "Category": "PROTECTED_HEALTH_INFORMATION", "Type": "ADDRESS", "Traits": [] } ], "UnmappedAttributes": [] }

검사, 치료 및 절차 범주

TEST_TREATMENT_PROCEDURE 범주는 의학적 상태를 판단하는 데 사용되는 절차를 탐지합니다. 여기에는 두 가지 엔터티 유형, 두 가지 속성이 포함됩니다. 하나 이상의 속성이 해당 TEST_NAME 유형의 엔터티 하나와 관련될 수 있습니다.

유형

  • PROCEDURE_NAME: 의학적 상태를 치료하거나 환자 케어를 위해 환자에게 일회성으로 시행하는 중재술.

  • TEST_NAME: 결과 값이 있을 수 있는 진단, 측정, 검사 또는 등급 지정을 위해 환자에게 수행하는 절차. 여기에는 진단을 내리거나, 상태를 배제하거나, 환자를 평가하거나 점수를 지정을 위한 모든 절차, 평가 또는 등급 지정이 포함됩니다.

  • TREATMENT_NAME: 질병 또는 이상을 퇴치하기 위해 일정 기간 동안 시행되는 중재술. 여기에는 항바이러스제 및 백신 접종 같은 약물 투여 그룹화가 포함됩니다.

속성

  • TEST_VALUE: 검사 결과. TEST_NAME 엔터티 유형에만 적용됩니다.

  • TEST_UNIT:검사 값과 함께 표시될 수 있는 측정 단위. TEST_NAME 엔터티 유형에만 적용됩니다.

특성

  • FUTURE: 검사, 치료 또는 절차가 메모의 주제 이후에 일어날 조치나 사건을 의미한다는 표시.

  • HYPOTHETICAL: 검사, 치료 또는 절차가 가설로 표현되었음을 나타내는 표시.

  • NEGATION: 검사, 치료 또는 시술이 네거티브이거나 시행되지 않고 있다는 표시.

  • PAST_HISTORY: 검사, 치료 또는 절차가 환자의 과거(현재 만남 이전)에서 비롯되었음을 나타내는 표시.

텍스트 복부 초음파에서 급성 충수염이 발견되었으며 여러 가지 광범위한 항생제를 투여한 후 충수 절제술을 권장합니다는 다음을 반환합니다.

  • “복부 초음파”는 TEST_NAME 유형입니다.

  • “급성”은 ACUITY 유형입니다.

  • “충수염”은 DX_NAME 유형입니다.

  • DIAGNOSIS은 "충수염" 유형특성입니다.

  • “충수 절제술”은 PROCEDURE_NAME 유형입니다.

  • “광범위한 항생제”는 TREATMENT_NAME 유형입니다.

DetectEntities 작업은 다음 JSON 구조를 반환합니다.

{ "Entities": [ { "Id": 0, "BeginOffset": 0, "EndOffset": 20, "Score": 0.94855135679245, "Text": "Abdominal ultrasound", "Category": "TEST_TREATMENT_PROCEDURE", "Type": "TEST_NAME", "Traits": [] }, { "Id": 3, "BeginOffset": 27, "EndOffset": 32, "Score": 0.9067845940589905, "Text": "acute", "Category": "MEDICAL_CONDITION", "Type": "ACUITY", "Traits": [] }, { "Id": 4, "BeginOffset": 33, "EndOffset": 45, "Score": 0.9954161643981934, "Text": "appendicitis", "Category": "MEDICAL_CONDITION", "Type": "DX_NAME", "Traits": [ { "Name": "DIAGNOSIS", "Score": 0.9528769254684448 } ] }, { "Id": 1, "BeginOffset": 57, "EndOffset": 69, "Score": 0.9957893490791321, "Text": "appendectomy", "Category": "TEST_TREATMENT_PROCEDURE", "Type": "PROCEDURE_NAME", "Traits": [] }, { "Id": 2, "BeginOffset": 100, "EndOffset": 126, "Score": 0.9437107443809509, "Text": "broad spectrum antibiotics", "Category": "TEST_TREATMENT_PROCEDURE", "Type": "TREATMENT_NAME", "Traits": [] } ], "UnmappedAttributes": [] }