Schwärzen oder Identifizieren von PII in einem Echtzeit-Datenstrom - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Schwärzen oder Identifizieren von PII in einem Echtzeit-Datenstrom

Amazon Transcribe Ersetzt bei der Schwärzung von persönlich identifizierbaren Informationen (PII) aus einer Streaming-Transkription jede identifizierte Instanz von PII durch [PII] in Ihrem Transkript.

Eine zusätzliche Option für Streaming-Transkriptionen ist die Identifizierung von personenbezogenen Daten. Wenn Sie PII Identification aktivieren, Amazon Transcribe kennzeichnet die PII in Ihren Transkriptionsergebnissen unter einem Objekt. Entities Ein Beispiel für die Ausgabe finden Sie unter Beispiel für eine redigierte Streaming-Ausgabe und Beispiel für eine PII-Identifikationsausgabe.

Die Bearbeitung und Identifizierung personenbezogener Daten mit Streaming-Transkriptionen ist in den folgenden englischen Dialekten verfügbar: Australischer (en-AU), Britischer (), US-amerikanischer () und spanischer US-Dialekt (en-GBen-US). es-US

Die Identifizierung und Schwärzung von personenbezogenen Daten bei Streaming-Aufträgen erfolgt erst nach vollständiger Transkription der Audiosegmente.

Arten von personenbezogenen Daten, die bei Streaming-Transkriptionen erkannt werden können Amazon Transcribe
PII-Typ Beschreibung
ADDRESS

Eine physische Adresse, z. B. 100 Main Street, Anytown, USA oder Suite #12, Gebäude 123. Eine Adresse kann eine Straße, ein Gebäude, einen Ort, eine Stadt, ein Bundesland, ein Land, eine Grafschaft, eine Postleitzahl, einen Bezirk, ein Stadtviertel und mehr enthalten.

ALL

Schwärzen oder identifizieren Sie alle in dieser Tabelle aufgeführten PII-Typen.

BANK_ACCOUNT_NUMBER

Eine US-Bankkontonummer. Diese sind in der Regel zwischen 10 und 12 Ziffern lang, aber Amazon Transcribe erkennt auch Bankkontonummern, bei denen nur die letzten 4 Ziffern vorhanden sind.

BANK_ROUTING

Eine US-Bankleitzahl. Diese sind in der Regel 9 Ziffern lang, aber Amazon Transcribe erkennt auch Routing-Nummern, bei denen nur die letzten 4 Ziffern vorhanden sind.

CREDIT_DEBIT_CVV

Ein dreistelliger Kartenbestätigungscode (CVV), der auf Kredit- und Debitkarten von VISA und Discover vorhanden ist. MasterCard Bei American Express-Kredit- oder Debitkarten handelt es sich um einen 4-stelligen Zahlencode.

CREDIT_DEBIT_EXPIRY

Das Ablaufdatum einer Kredit- oder Debitkarte. Diese Zahl ist in der Regel 4-stellig und wird als Monat/Jahr oder MM/JJJJ formatiert. Amazon Transcribe Kann beispielsweise Ablaufdaten wie den 21. Januar, den 1. Januar 2021 und den 1. Januar 2021 erkennen.

CREDIT_DEBIT_NUMBER

Die Nummer einer Kredit- oder Debitkarte. Diese Zahlen können zwischen 13 und 16 Ziffern lang sein, erkennen aber Amazon Transcribe auch Kredit- oder Debitkartennummern, wenn nur die letzten 4 Ziffern vorhanden sind.

EMAIL

Eine E-Mail-Adresse, z. B. efua.owusu@email.com.

NAME

Der Name einer Person. Dieser Entitätstyp umfasst keine Titel wie Herr, Frau, Fräulein oder Dr.. Er wendet diesen Entitätstyp Amazon Transcribe nicht auf Namen an, die Teil von Organisationen oder Adressen sind. Amazon Transcribe Erkennt beispielsweise die John Doe Organization als Organisation und Jane Doe Street als Adresse.

PHONE

Eine Telefonnummer. Dieser Entitätstyp umfasst auch Fax- und Pager-Nummern.

PIN

Eine 4-stellige persönliche Identifikationsnummer (PIN), mit der jemand Zugang zu seinen Kontodaten erhält.

SSN

Eine Sozialversicherungsnummer (SSN) ist eine 9-stellige Nummer, die an US-Bürger, Personen mit ständigem Wohnsitz und Personen mit vorübergehender Erwerbstätigkeit vergeben wird. Amazon Transcribe erkennt auch Sozialversicherungsnummern, wenn nur die letzten 4 Ziffern vorhanden sind.

Sie können eine Streaming-Transkription mit AWS Management Console WebSocket, oder HTTP/2 starten.

  1. Melden Sie sich beim AWS Management Console an.

  2. Wählen Sie im Navigationsbereich Echtzeit-Streaming aus. Scrollen Sie nach unten zu Einstellungen für das Entfernen von Inhalten und erweitern Sie dieses Feld, falls es minimiert ist.

    Amazon Transcribe Konsolen-Screenshot: Die Seite „Transkription in Echtzeit“.
  3. Umschalten auf PII-Identifizierung und Schwärzung.

    Amazon Transcribe Konsolen-Screenshot: das erweiterte Fenster mit den Einstellungen für das Entfernen von Inhalten.
  4. Wählen Sie Nur Identifizierung oder Identifizierung und Schwärzung und wählen Sie dann die Arten von personenbezogenen Daten, die Sie in Ihrem Transkript identifizieren oder schwärzen möchten.

    Amazon Transcribe Konsolen-Screenshot: Liste der PII-Typen, die ausgewählt werden können.
  5. Jetzt können Sie Ihren Stream transkribieren. Wählen Sie Streaming starten und beginnen Sie zu sprechen. Um Ihr Diktat zu beenden, wählen Sie Streaming beenden.

In diesem Beispiel wird eine vorsignierte URL erstellt, die PII-Schwärzung (oder PII-Identifizierung) in einem Stream verwendet. WebSocket Für eine bessere Lesbarkeit werden Zeilenumbrüche hinzugefügt. Weitere Informationen zur Verwendung von WebSocket Streams mit finden Sie unter. Amazon TranscribeEinen WebSocket Stream einrichten Weitere Einzelheiten zu den Parametern finden Sie unter StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

Sie können nicht sowohl content-identification-type als auch content-redaction-type in derselben Anfrage verwenden.

Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allen AWS API-Vorgängen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.

In diesem Beispiel wird eine HTTP/2-Anfrage mit aktivierter PII-Identifizierung oder PII-Redaktion erstellt. Weitere Informationen zur Verwendung von HTTP/2-Streaming mit finden Sie Amazon Transcribe unterEinrichten eines HTTP/2-Streams. Weitere Informationen zu spezifischen Parametern und Headern finden Sie Amazon Transcribe unter. StartStreamTranscription

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

Sie können nicht sowohl content-identification-type als auch content-redaction-type in derselben Anfrage verwenden.

Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allen AWS API-Vorgängen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.

Anmerkung

Die Bearbeitung personenbezogener Daten für das Streaming wird nur in folgenden Ländern unterstützt AWS-Regionen: Asien-Pazifik (Seoul), Asien-Pazifik (Sydney), Asien-Pazifik (Tokio), Kanada (Zentral), EU (Frankfurt), EU (Irland), EU (London), USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon).