Menyunting atau mengidentifikasi PII dalam streaming waktu nyata - Amazon Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menyunting atau mengidentifikasi PII dalam streaming waktu nyata

Saat menyunting informasi identitas pribadi (PII) dari transkripsi streaming, Amazon Transcribe ganti setiap instance PII yang diidentifikasi dengan transkrip Anda. [PII]

Opsi tambahan yang tersedia untuk transkripsi streaming adalah identifikasi PII. Saat Anda mengaktifkan Identifikasi PII, beri Amazon Transcribe label PII dalam hasil transkripsi Anda di bawah suatu objek. Entities Untuk sampel keluaran, lihat Contoh keluaran streaming yang disunting danContoh output identifikasi PII.

Redaksi dan identifikasi PII dengan transkripsi streaming tersedia dengan dialek bahasa Inggris ini: Australia (en-AU), Inggris (), AS (en-GB) dan dialek AS Spanyol (en-US). es-US

Identifikasi dan redaksi PII untuk pekerjaan streaming dilakukan hanya setelah transkripsi lengkap segmen audio.

Jenis PII Amazon Transcribe dapat mengenali transkripsi streaming
Jenis PII Deskripsi
ADDRESS

Alamat fisik, seperti 100 Main Street, Anytown, USA atau Suite #12, Building 123. Alamat dapat mencakup jalan, bangunan, lokasi, kota, negara bagian, negara, kabupaten, zip, kantor polisi, lingkungan, dan banyak lagi.

ALL

Menyunting atau mengidentifikasi semua jenis PII yang tercantum dalam tabel ini.

BANK_ACCOUNT_NUMBER

Nomor rekening bank AS. Ini biasanya antara 10 - 12 digit panjang, tetapi Amazon Transcribe juga mengenali nomor rekening bank ketika hanya 4 digit terakhir yang ada.

BANK_ROUTING

Nomor perutean rekening bank AS. Ini biasanya 9 digit panjang, tetapi Amazon Transcribe juga mengenali nomor routing ketika hanya 4 digit terakhir yang ada.

CREDIT_DEBIT_CVV

Kode verifikasi kartu 3 digit (CVV) yang ada di VISA MasterCard, serta Discover kartu kredit dan debit. Dalam kartu kredit atau debit American Express, ini adalah kode numerik 4 digit.

CREDIT_DEBIT_EXPIRY

Tanggal kedaluwarsa untuk kartu kredit atau debit. Angka ini biasanya 4 digit panjang dan diformat sebagai bulan/tahun atau MM/YY. Misalnya, Amazon Transcribe dapat mengenali tanggal kedaluwarsa seperti 01/21, 01/2021, dan Jan 2021.

CREDIT_DEBIT_NUMBER

Nomor untuk kartu kredit atau debit. Angka-angka ini dapat bervariasi dari 13 hingga 16 digit panjangnya, tetapi Amazon Transcribe juga mengenali nomor kartu kredit atau debit ketika hanya 4 digit terakhir yang ada.

EMAIL

Alamat email, seperti efua.owusu@email.com.

NAME

Nama seorang individu. Jenis entitas ini tidak termasuk judul, seperti Mr., Mrs., Miss, atau Dr. Amazon Transcribe tidak menerapkan jenis entitas ini untuk nama yang merupakan bagian dari organisasi atau alamat. Misalnya, Amazon Transcribe mengakui Organisasi John Doe sebagai sebuah organisasi, dan Jane Doe Street sebagai alamat.

PHONE

Nomor telepon. Jenis entitas ini juga mencakup nomor faks dan pager.

PIN

4 digit nomor identifikasi pribadi (PIN) yang memungkinkan seseorang untuk mengakses informasi rekening bank mereka.

SSN

Nomor Jaminan Sosial (SSN) adalah nomor 9 digit yang dikeluarkan untuk warga negara AS, penduduk tetap, dan penduduk yang bekerja sementara. Amazon Transcribe juga mengenali Nomor Jaminan Sosial ketika hanya 4 digit terakhir yang ada.

Anda dapat memulai transkripsi streaming menggunakan AWS Management Console, WebSocket, atau HTTP/2.

  1. Masuk ke AWS Management Console.

  2. Di panel navigasi, pilih Transkripsi waktu nyata. Gulir ke bawah ke pengaturan penghapusan konten dan perluas bidang ini jika diminimalkan.

    Amazon Transcribe tangkapan layar konsol: halaman 'transkripsi waktu-nyata'.
  3. Aktifkan Identifikasi & redaksi PII.

    Amazon Transcribe tangkapan layar konsol: panel 'pengaturan penghapusan konten' yang diperluas.
  4. Pilih Identifikasi saja atau Identifikasi & redaksi, lalu pilih jenis entitas PII yang ingin Anda identifikasi atau edit dalam transkrip Anda.

    Amazon Transcribe screenshot konsol: daftar jenis PII yang dapat dipilih.
  5. Anda sekarang siap untuk mentranskripsikan aliran Anda. Pilih Mulai streaming dan mulai berbicara. Untuk mengakhiri dikte Anda, pilih Hentikan streaming.

Contoh ini membuat URL presigned yang menggunakan redaksi PII (atau identifikasi PII) dalam aliran. WebSocket Jeda baris telah ditambahkan untuk keterbacaan. Untuk informasi selengkapnya tentang penggunaan WebSocket stream dengan Amazon Transcribe, lihatMenyiapkan WebSocket aliran. Untuk detail lebih lanjut tentang parameter, lihat StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

Anda tidak dapat menggunakan keduanya content-identification-type dan content-redaction-type dalam permintaan yang sama.

Definisi parameter dapat ditemukan di Referensi API; parameter yang umum untuk semua operasi AWS API tercantum di bagian Parameter Umum.

Contoh ini membuat permintaan HTTP/2 dengan identifikasi PII atau redaksi PII diaktifkan. Untuk informasi lebih lanjut tentang menggunakan streaming HTTP/2 dengan Amazon Transcribe, lihat. Menyiapkan aliran HTTP/2 Untuk detail selengkapnya tentang parameter dan header khusus untuk Amazon Transcribe, lihat StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

Anda tidak dapat menggunakan keduanya content-identification-type dan content-redaction-type dalam permintaan yang sama.

Definisi parameter dapat ditemukan di Referensi API; parameter yang umum untuk semua operasi AWS API tercantum di bagian Parameter Umum.

catatan

Redaksi PII untuk streaming hanya didukung dalam hal ini Wilayah AWS: Asia Pasifik (Seoul), Asia Pasifik (Sydney), Asia Pasifik (Tokyo), Kanada (Tengah), UE (Frankfurt), UE (Irlandia), UE (London), AS Timur (Virginia N.), AS Timur (Ohio), dan AS Barat (Oregon).