Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Schwärzen oder Identifizieren von PII in einem Echtzeit-Datenstrom
Amazon Transcribe Ersetzt bei der Schwärzung von persönlich identifizierbaren Informationen (PII) aus einer Streaming-Transkription jede identifizierte Instanz von PII durch [PII]
in Ihrem Transkript.
Eine zusätzliche Option für Streaming-Transkriptionen ist die Identifizierung von personenbezogenen Daten. Wenn Sie PII Identification aktivieren, Amazon Transcribe kennzeichnet die PII in Ihren Transkriptionsergebnissen unter einem Objekt. Entities
Ein Beispiel für die Ausgabe finden Sie unter Beispiel für eine geschwärzte Streaming-Ausgaben und Beispiel für eine Identifikationsausgabe PII.
Die Bearbeitung und Identifizierung personenbezogener Daten mit Streaming-Transkriptionen ist in den folgenden englischen Dialekten verfügbar: Australischer (en-AU
), Britischer (), US-amerikanischer () und spanischer US-Dialekt (en-GB
en-US
). es-US
Die Identifizierung und Schwärzung von personenbezogenen Daten bei Streaming-Aufträgen erfolgt erst nach vollständiger Transkription der Audiosegmente.
PII-Typ | Beschreibung |
---|---|
ADDRESS |
Eine physische Adresse, z. B. 100 Main Street, Anytown, USA oder Suite #12, Gebäude 123. Eine Adresse kann eine Straße, ein Gebäude, einen Ort, eine Stadt, ein Bundesland, ein Land, eine Grafschaft, eine Postleitzahl, einen Bezirk, ein Stadtviertel und mehr enthalten. |
ALL |
Schwärzen oder identifizieren Sie alle in dieser Tabelle aufgeführten PII-Typen. |
BANK_ACCOUNT_NUMBER |
Eine US-Bankkontonummer. Diese sind in der Regel zwischen 10 und 12 Ziffern lang, aber Amazon Transcribe erkennt auch Bankkontonummern, bei denen nur die letzten 4 Ziffern vorhanden sind. |
BANK_ROUTING |
Eine US-Bankleitzahl. Diese sind in der Regel 9 Ziffern lang, aber Amazon Transcribe erkennt auch Routing-Nummern, bei denen nur die letzten 4 Ziffern vorhanden sind. |
CREDIT_DEBIT_CVV |
Ein dreistelliger Kartenbestätigungscode (CVV), der auf Kredit- und Debitkarten von VISA und Discover vorhanden ist. MasterCard Bei American Express-Kredit- oder Debitkarten handelt es sich um einen 4-stelligen Zahlencode. |
CREDIT_DEBIT_EXPIRY |
Das Ablaufdatum einer Kredit- oder Debitkarte. Diese Zahl ist in der Regel 4-stellig und wird als Monat/Jahr oder MM/JJJJ formatiert. Amazon Transcribe Kann beispielsweise Ablaufdaten wie den 21. Januar, den 1. Januar 2021 und den 1. Januar 2021 erkennen. |
CREDIT_DEBIT_NUMBER |
Die Nummer einer Kredit- oder Debitkarte. Diese Zahlen können zwischen 13 und 16 Ziffern lang sein, erkennen aber Amazon Transcribe auch Kredit- oder Debitkartennummern, wenn nur die letzten 4 Ziffern vorhanden sind. |
EMAIL |
Eine E-Mail-Adresse, z. B. efua.owusu@email.com. |
NAME |
Der Name einer Person. Dieser Entitätstyp umfasst keine Titel wie Herr, Frau, Fräulein oder Dr.. Er wendet diesen Entitätstyp Amazon Transcribe nicht auf Namen an, die Teil von Organisationen oder Adressen sind. Amazon Transcribe Erkennt beispielsweise die John Doe Organization als Organisation und Jane Doe Street als Adresse. |
PHONE |
Eine Telefonnummer. Dieser Entitätstyp umfasst auch Fax- und Pager-Nummern. |
PIN |
Eine 4-stellige persönliche Identifikationsnummer (PIN), mit der jemand Zugang zu seinen Kontodaten erhält. |
SSN |
Eine Sozialversicherungsnummer (SSN) ist eine 9-stellige Nummer, die an US-Bürger, Personen mit ständigem Wohnsitz und Personen mit vorübergehender Erwerbstätigkeit vergeben wird. Amazon Transcribe erkennt auch Sozialversicherungsnummern, wenn nur die letzten 4 Ziffern vorhanden sind. |
Sie können eine Streaming-Transkription mit AWS Management Console WebSocket, oder HTTP/2 starten.
-
Melden Sie sich beim AWS Management Console
an. -
Wählen Sie im Navigationsbereich Echtzeit-Streaming aus. Scrollen Sie nach unten zu Einstellungen für das Entfernen von Inhalten und erweitern Sie dieses Feld, falls es minimiert ist.
-
Umschalten auf PII-Identifizierung und Schwärzung.
-
Wählen Sie Nur Identifizierung oder Identifizierung und Schwärzung und wählen Sie dann die Arten von personenbezogenen Daten, die Sie in Ihrem Transkript identifizieren oder schwärzen möchten.
-
Jetzt können Sie Ihren Stream transkribieren. Wählen Sie Streaming starten und beginnen Sie zu sprechen. Um Ihr Diktat zu beenden, wählen Sie Streaming beenden.
In diesem Beispiel wird eine vorsignierte URL erstellt, die PII-Schwärzung (oder PII-Identifizierung) in einem Stream verwendet. WebSocket Für eine bessere Lesbarkeit werden Zeilenumbrüche hinzugefügt. Weitere Informationen zur Verwendung von WebSocket Streams mit finden Sie unter. Amazon TranscribeEinen WebSocket Stream einrichten Weitere Einzelheiten zu den Parametern finden Sie unter StartStreamTranscription
.
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208
T235959
Z &X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US
&media-encoding=flac
&sample-rate=16000
&pii-entity-types=NAME
,ADDRESS
&content-redaction-type=PII (or &content-identification-type=PII)
Sie können nicht sowohl content-identification-type
als auch content-redaction-type
in derselben Anfrage verwenden.
Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allen AWS API-Vorgängen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.
In diesem Beispiel wird eine HTTP/2-Anfrage mit aktivierter PII-Identifizierung oder PII-Redaktion erstellt. Weitere Informationen zur Verwendung von HTTP/2-Streaming mit finden Sie Amazon Transcribe unterEinrichten eines HTTP/2-Streams. Weitere Informationen zu spezifischen Parametern und Headern finden Sie Amazon Transcribe unter. StartStreamTranscription
POST /stream-transcription HTTP/2 host: transcribestreaming.
us-west-2
.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:string
X-Amz-Date:20220208
T235959
Z Authorization: AWS4-HMAC-SHA256 Credential=access-key
/20220208
/us-west-2
/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code:en-US
x-amzn-transcribe-media-encoding:flac
x-amzn-transcribe-sample-rate:16000
x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types:transfer-encoding: chunked
NAME
,ADDRESS
Sie können nicht sowohl content-identification-type
als auch content-redaction-type
in derselben Anfrage verwenden.
Parameterdefinitionen finden Sie in der API-Referenz. Parameter, die allen AWS API-Vorgängen gemeinsam sind, sind im Abschnitt Allgemeine Parameter aufgeführt.
Anmerkung
Die Bearbeitung personenbezogener Daten für das Streaming wird nur in folgenden Ländern unterstützt AWS-Regionen: Asien-Pazifik (Seoul), Asien-Pazifik (Sydney), Asien-Pazifik (Tokio), Kanada (Zentral), EU (Frankfurt), EU (Irland), EU (London), USA Ost (Nord-Virginia), USA Ost (Ohio) und USA West (Oregon).