실시간 스트림에서 PII 편집 또는 식별 - Amazon Transcribe

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

실시간 스트림에서 PII 편집 또는 식별

스트리밍 트랜스크립션에서 개인 식별 정보(PII)를 편집하는 경우 Amazon Transcribe 는 식별된 각 PII 인스턴스를 트랜스크립트의 [PII]로 대체합니다.

스트리밍 트랜스크립션에 사용할 수 있는 추가 옵션은 PII 식별입니다. PII 식별을 활성화하면 트랜스크립션 결과의 PII에 개체 아래에 Amazon Transcribe 레이블을 지정합니다. Entities 출력 샘플은 편집된 스트리밍 출력 예시식별 출력 예시 PII를 참조하세요.

스트리밍 트랜스크립션을 통한 PII의 수정 및 식별은 호주 (en-AU), 영국 (), 미국 () 및 스페인 미국 방언 () 과 같은 영어 방언을 사용하여 사용할 수 있습니다. en-GB en-US es-US

스트리밍 작업에 대한 PII 식별 및 수정은 오디오 세그먼트의 완전한 트랜스크립션 시에만 수행됩니다.

스트리밍 트랜스크립션에서 인식할 수 있는 Amazon Transcribe PII의 유형
PII 유형 설명
ADDRESS

실제 주소(예: 100 Main Street, Anytown, USA 또는 Suite #12, Building 123). 주소에는 거리, 건물, 위치, 도시, 주, 국가, 카운티, 우편번호, 구역, 지역 등의 정보가 포함될 수 있습니다.

ALL

이 테이블에 나열된 모든 PII 유형을 편집하거나 식별합니다.

BANK_ACCOUNT_NUMBER

미국 은행 계좌 번호. 일반적으로 10~12자리 길이이지만 Amazon Transcribe 는 마지막 4자리만 있으면 은행 계좌 번호도 인식합니다.

BANK_ROUTING

미국 은행 계좌 라우팅 번호. 일반적으로 9자리 길이이지만 Amazon Transcribe 는 마지막 4자리만 있으면 라우팅 번호도 인식합니다.

CREDIT_DEBIT_CVV

VISA MasterCard, Discover 신용카드 및 직불카드에 있는 3자리 카드 확인 코드 (CVV). 아메리칸 익스프레스 신용카드나 직불카드의 경우 4자리 숫자 코드입니다.

CREDIT_DEBIT_EXPIRY

신용카드 또는 직불카드 만료 날짜. 이 숫자는 보통 4자리 숫자이며, 월/년 또는 MM/YY 형식으로 지정됩니다. 예를 들어 01/21, 2021년 1월, 2021년 1월과 같은 만료일을 Amazon Transcribe 인식할 수 있습니다.

CREDIT_DEBIT_NUMBER

신용카드 또는 직불카드 번호. 이 번호의 길이는 13~16자리까지 다양하지만 마지막 4자리만 있는 경우 신용카드 또는 직불카드 Amazon Transcribe 번호도 인식합니다.

EMAIL

이메일 주소(예: efua.owusu@email.com).

NAME

개인의 이름. 이 개체 유형에는 Mr., Mrs., Miss 또는 Dr.와 같은 직함은 포함되지 Amazon Transcribe 않습니다. 또는 Dr.는 조직 또는 주소의 일부인 이름에는 이 개체 유형을 적용하지 않습니다. 예를 들어, John Doe 조직을 조직으로 Amazon Transcribe 인식하고 Jane Doe Street를 주소로 인식합니다.

PHONE

전화번호. 이 엔터티 유형에는 팩스 및 호출기 번호도 포함됩니다.

PIN

다른 사람이 자신의 은행 계좌 정보에 액세스할 수 있도록 하는 4자리 개인 식별 번호(PIN).

SSN

사회보장번호 (SSN) 는 미국 시민권자, 영주권자, 임시 근로 거주자에게 발급되는 9자리 숫자입니다. Amazon Transcribe 또한 마지막 4자리만 있는 경우 사회보장번호를 인식합니다.

AWS Management Console WebSocket, 또는 HTTP/2를 사용하여 스트리밍 트랜스크립션을 시작할 수 있습니다.

  1. AWS Management Console에 로그인합니다.

  2. 탐색 창에서 실시간 트랜스크립션을 선택합니다. 콘텐츠 제거 설정까지 아래로 스크롤하고 최소화된 경우 이 필드를 확장합니다.

    Amazon Transcribe 콘솔 스크린샷: '실시간 트랜스크립션' 페이지
  3. PII 식별 및 수정을 켭니다.

    Amazon Transcribe 콘솔 스크린샷: 확장된 '콘텐츠 제거 설정' 패널
  4. 식별만 또는 식별 및 수정을 선택한 다음, 트랜스크립트에서 식별하거나 수정하려는 PII 엔터티 유형을 선택합니다.

    Amazon Transcribe 콘솔 스크린샷: 선택할 수 있는 PII 유형 목록.
  5. 이제 스트림을 트랜스크립션할 준비가 되었습니다. 스트리밍 시작을 선택하고 말하기 시작합니다. 구술을 끝내려면 스트리밍 중지를 선택합니다.

이 예제는 스트림에서 PII 수정 (또는 PII 식별) 을 사용하는 미리 서명된 URL을 만듭니다. WebSocket 가독성을 높이기 위해 줄바꿈이 추가되었습니다. 에서 WebSocket 스트림을 사용하는 방법에 대한 자세한 내용은 을 참조하십시오. Amazon Transcribe WebSocket 스트림 설정 파라미터에 대한 자세한 내용은 StartStreamTranscription을 참조하세요.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

동일한 요청에서 content-identification-typecontent-redaction-type 둘 다 사용할 수는 없습니다.

매개변수 정의는 API 참조에서 찾을 수 있으며, 모든 AWS API 작업에 공통적인 매개변수는 공통 매개변수 섹션에 나열되어 있습니다.

이 예시에서는 PII 식별 또는 PII 수정이 활성화된 HTTP/2 요청을 생성합니다. HTTP/2 스트리밍을 사용하는 방법에 대한 자세한 내용은 을 Amazon Transcribe참조하십시오. HTTP/2 스트림 설정 관련 파라미터 및 헤더에 대한 자세한 내용은 을 참조하십시오. Amazon TranscribeStartStreamTranscription

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

동일한 요청에서 content-identification-typecontent-redaction-type 둘 다 사용할 수는 없습니다.

매개변수 정의는 API 참조에서 찾을 수 있으며, 모든 AWS API 작업에 공통적인 매개변수는 공통 매개변수 섹션에 나열되어 있습니다.

참고

스트리밍을 위한 PII 수정은 아시아 태평양 (서울), 아시아 태평양 (시드니), 아시아 태평양 (도쿄), 캐나다 (중부), EU (프랑크푸르트), EU (아일랜드), EU (런던), 미국 동부 (버지니아 북부), 미국 동부 (오하이오), 미국 서부 (오레곤) 에서만 지원됩니다. AWS 리전