リアルタイムストリーミングの PII の編集または識別 - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

リアルタイムストリーミングの PII の編集または識別

ストリーミングトランスクリプションから個人を特定できる情報 (PII) を編集する場合、[PII]お客様のトランスクリプトに、特定された PII の各インスタンスをAmazon Transcribeに置き換えます。

文字起こしに利用できる追加オプションとして、PII 識別があります。PII 識別を有効にすると、文字起こし結果の PII をAmazon TranscribeEntitiesオブジェクトの下にラベル付けします。出力サンプルについては、「編集済みストリーミング出力の例」と「PII 識別の出力例」を参照してください。

ストリーミング文字起こしによる個人情報の編集と識別は、オーストラリア (en-AU)、英国 ()、米国 (en-GBen-US) の英語方言で可能です。

ストリーミングジョブの PII 識別とリダクションは、オーディオセグメントの完全な文字起こし時にのみ実行されます。

Amazon Transcribeストリーミング文字変換で認識できるPIIの種類
PII タイプ 説明
ADDRESS

実際の住所 (米国エニータウンのメインストリート 100 番地、 123 号館のスイート #12 など) 住所には、通り、建物、場所、市、州、国、郡、郵便番号、地区、近隣地域などを含めることができます。

ALL

この表に記載されているすべての PII の種類を編集または特定します。

BANK_ACCOUNT_NUMBER

米国の銀行口座番号。通常 10 ~ 12 桁ですが、銀行口座番号が最後の 4Amazon Transcribe 桁しかない場合でも認識されます。

BANK_ROUTING

米国の銀行口座ルーティング番号。これらは通常 9 桁ですが、最後の 4Amazon Transcribe 桁しかないルーティング番号も認識します。

CREDIT_DEBIT_CVV

VISA、Discoverのクレジットカードおよびデビットカードに記載されている3桁のカード認証コード(CVV)。 MasterCardAmerican Expressのクレジットカードまたはデビットカードでは、4桁の数字コードです。

CREDIT_DEBIT_EXPIRY

クレジットカードまたはデビットカードの有効期限。この数値は通常 4 桁で、月/年または MM/YY としてフォーマットされます。たとえば、有効期限が 21 日、2021 年 1 1 日、2021 年 1Amazon Transcribe 月などの有効期限を認識できます。

CREDIT_DEBIT_NUMBER

クレジットカードまたはデビットカードの番号。これらの番号は 13 桁から 16 桁までさまざまですが、クレジットカード番号やデビットカード番号が最後の 4Amazon Transcribe 桁しかない場合でも認識されます。

EMAIL

メールアドレス (efua.owusu@email.com など)。

NAME

個人の名前。このエンティティタイプには役職は含まれません。たとえば、Mr.、Mrs.、Miss、Dr. は、Amazon Transcribe組織または住所の一部である名前にはこのエンティティタイプを適用しません。たとえば、はジョン・ドウ・オーガニゼーションを組織として、Amazon Transcribeジェーンドゥ・ストリートを住所として認識します

PHONE

電話番号 このエンティティタイプには、ファックス番号とポケットベル番号も含まれます。

PIN

誰かが自分の銀行口座情報にアクセスできるようにする 4 桁の個人識別番号 (PIN)。

SSN

社会保障番号(SSN)は、米国市民、永住者、および一時就労者に発行される9桁の番号です。 Amazon Transcribeまた、社会保障番号が最後の 4 桁しかない場合にも認識されます。

、、HTTP/2AWS Management Console でストリーミングの文字起こしを開始できます。 WebSocket

  1. AWS Management Console にサインインします。

  2. ナビゲーションペインで、[リアルタイム文字起こし] を選択します。コンテンツ削除設定にスクロールして、最小化されている場合はこのフィールドを展開します。

    
                    Amazon Transcribeコンソールのスクリーンショット:「リアルタイム文字起こし」ページ
  3. PII の識別と編集をオンに切り替えます

    
                    Amazon Transcribeコンソールのスクリーンショット:拡張された「コンテンツ削除設定」パネル
  4. 識別のみ」または「識別と編集」を選択し、トランスクリプトで識別または編集したいPIIエンティティタイプを選択します。

    
                    Amazon Transcribeコンソールのスクリーンショット:選択可能な PII タイプのリスト。
  5. これで、ストリームを書き起こす準備ができました。[ストリーミングを開始] を選択し、話し始めます。ディクテーションを終了するには、「ストリーミングを停止」を選択します。

この例では、 WebSocket ストリーム内で PII 編集 (または PII 識別) を使用する署名付き URL を作成します。読みやすくするために、改行が追加されています。 WebSocket でのストリームの使用の詳細についてはAmazon Transcribe、を参照してくださいのセットアップ WebSocket ストリーム。パラメータの詳細については、「StartStreamTranscription」を参照してください。

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

content-identification-typecontent-redaction-type同じリクエストでとの両方を使用することはできません。

パラメータの定義は API リファレンスにあります。すべてのAWS API オペレーションに共通するパラメータは、「共通パラメータ」セクションに記載されています。

この例では、PII 識別または PII 編集を有効にした状態で HTTP/2 リクエストを作成します。で HTTP/2 ストリーミングを使用する際の詳細についてはAmazon Transcribe、を参照してくださいHTTP/2 ストリームの設定。に固有のパラメータとヘッダーの詳細についてはAmazon Transcribe、を参照してくださいStartStreamTranscription

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

content-identification-typecontent-redaction-type同じリクエストでとの両方を使用することはできません。

パラメータの定義は API リファレンスにあります。すべてのAWS API オペレーションに共通するパラメータは、「共通パラメータ」セクションに記載されています。

注記

ストリーミングのAWS リージョン PII 編集は、アジアパシフィック (ソウル)、アジアパシフィック (東京)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン) でのみサポートされています。