PII 탐지 - Amazon Comprehend Medical

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

PII 탐지

임상 텍스트를 스캔할 때 보호 대상 건강 정보(PHI) 데이터만 탐지하려는 경우 DetectPHI 작업을 사용합니다. 임상 텍스트에서 사용 가능한 모든 엔터티를 검색하려면 DetectEntitiesV2를 사용합니다.

이 API는 PHI 엔터티 탐지만 필요한 사용 사례에 가장 적합합니다. 비 PHI 범주의 정보에 대한 자세한 내용은 엔터티 탐지 섹션을 참조하십시오.

중요

Amazon Comprehend Medical은 탐지된 엔터티의 정확성에 대한 신뢰 수준을 나타내는 신뢰도 점수를 제공합니다. 이러한 신뢰도 점수를 평가하고 사용 사례에 적합한 신뢰 임계값을 식별합니다. 특정 규정 준수 사용 사례의 경우, 추가 인적 검토 또는 기타 방법을 사용하여 탐지된 PHI의 정확성을 확인하는 것이 좋습니다.

HIPAA 법에 따라 18개 식별자 목록을 기반으로 하는 PHI는 특별한 주의를 기울여 취급해야 합니다. Amazon Comprehend Medical은 이러한 식별자와 관련된 엔터티를 탐지하지만 이러한 엔터티를 세이프 하버 방법으로 지정된 목록에 1:1로 매핑하지 않습니다. 모든 식별자가 비정형 임상 텍스트에 포함되는 것은 아니지만 Amazon Comprehend Medical은 모든 관련 식별자를 포함합니다. 이러한 식별자는 다음 목록을 포함하여 개별 환자를 식별하는 데 사용할 수 있는 데이터로 구성됩니다. 자세한 내용은 미국 정부 보건 복지 서비스 웹사이트의 Health Information Privacy를 참조하십시오.

각 PHI 관련 엔터티에는 Amazon Comprehend Medical의 탐지 정확도에 대한 신뢰도 수준을 나타내는 점수(응답의 Score)가 포함되어 있습니다. 사용 사례에 적합한 신뢰 임계값을 식별하고 이를 충족하지 않는 엔터티를 걸러냅니다. PHI 발생을 식별할 때는 탐지된 잠재적 엔터티를 더 많이 캡처하기 위해 필터링에 낮은 신뢰도 임계값을 사용하는 것이 더 나을 수 있습니다. 규정 준수 사용 사례에서 탐지된 엔터티의 값을 사용하지 않는 경우 특히 그렇습니다.

DetectPHI 또는 DetectEntitiesV2 작업을 실행하여 다음과 같은 PHI 관련 엔터티를 탐지할 수 있습니다.

탐지된 PHI 엔터티

엔터티

설명

HIPAA 범주

AGE

환자, 가족 또는 메모에 관련된 다른 사람의 연령, 연령 범위, 언급된 연령의 모든 구성 요소. 달리 명시되지 않는 한 기본값은 연도입니다.

3. 개인과 관련된 날짜

DATE 환자 또는 환자 치료와 관련된 모든 날짜. 3. 개인과 관련된 날짜

NAME

임상 기록에 기재된 모든 이름(일반적으로 환자, 가족 또는 의료 제공자의 이름).

1. 이름

PHONE_OR_FAX

모든 전화, 팩스, 호출기. 1-800-QUIT-NOW 및 911과 같은 기명 전화번호는 제외됩니다.

4. 전화번호

5. 팩스 번호

EMAIL

이메일 주소.

6. 이메일 주소

ID

환자 신원과 관련된 모든 종류의 번호. 여기에는 주민등록번호, 의료 기록 번호, 시설 식별 번호, 임상 시험 번호, 증명서 또는 면허 번호, 차량 또는 디바이스 번호가 포함됩니다. 또한 생체인식 번호, 진료 장소 또는 의료 서비스 제공자를 식별하는 번호도 포함됩니다.

7. 사회 보장 번호

8. 의료 기록 번호

9. 건강 보험 번호

10. 계정 번호

11. 인증서/면허 번호

12. 차량 식별자

13. 디바이스 번호

16. 생체 인식 정보

18. 기타 모든 식별 특성

URL

모든 웹 URL.

14. URL

ADDRESS

여기에는 시설, 유명 의료 시설 또는 시설 내 병동 주소의 모든 지리적 세분화가 포함됩니다.

2. 지리적 위치

PROFESSION

환자 또는 환자 가족과 관련된 것으로 메모에 언급된 모든 직업 또는 고용주를 포함합니다.

18. 기타 모든 식별 특징

텍스트 “환자는 워싱턴 주 시애틀에 거주하고 있는 48세의 교사 존 스미스입니다.” 반환 값은 다음과 같습니다.

  • “존 스미스"는 PROTECTED_HEALTH_INFORMATION 범주에 있는 NAME 유형의 엔터티입니다.

  • “48"은 PROTECTED_HEALTH_INFORMATION 범주에 있는 AGE 유형의 엔터티입니다.

  • "교사"는 PROTECTED_HEALTH_INFORMATION 범주에 있는 PROFESSION 유형(식별 특징)의 엔터티입니다.

  • “워싱턴주 시애틀”은 PROTECTED_HEALTH_INFORMATION 범주에 속하는 ADDRESS 엔터티입니다.

Amazon Comprehend Medical 콘솔에서는 다음과 같이 표시됩니다.

DetectPHI 작업을 사용할 때 응답은 다음과 같이 표시됩니다. StartPHIDetectionJob 작업을 사용하면 Amazon Comprehend Medical은 출력 위치에 이 구조를 사용하여 파일을 생성합니다.

{ "Entities": [ { "Id": 0, "BeginOffset": 11, "EndOffset": 21, "Score": 0.997368335723877, "Text": "John Smith", "Category": "PROTECTED_HEALTH_INFORMATION", "Type": "NAME", "Traits": [] }, { "Id": 1, "BeginOffset": 25, "EndOffset": 27, "Score": 0.9998362064361572, "Text": "48", "Category": "PROTECTED_HEALTH_INFORMATION", "Type": "AGE", "Traits": [] }, { "Id": 2, "BeginOffset": 37, "EndOffset": 44, "Score": 0.8661606311798096, "Text": "teacher", "Category": "PROTECTED_HEALTH_INFORMATION", "Type": "PROFESSION", "Traits": [] }, { "Id": 3, "BeginOffset": 61, "EndOffset": 68, "Score": 0.9629441499710083, "Text": "Seattle", "Category": "PROTECTED_HEALTH_INFORMATION", "Type": "ADDRESS", "Traits": [] }, { "Id": 4, "BeginOffset": 78, "EndOffset": 88, "Score": 0.38217034935951233, "Text": "Washington", "Category": "PROTECTED_HEALTH_INFORMATION", "Type": "ADDRESS", "Traits": [] } ], "UnmappedAttributes": [] }