AWS SDK for Python (Boto) - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS SDK for Python (Boto)

この演習では、SDK for Python を使用して、音声をテキストに記録するスクリプトを作成します。この演習を完了するには、以下のことが必要です。

  • AWS CLI をインストールします。詳細については、「ステップ 2: をセットアップするAWS Command Line Interface(AWS CLI)」を参照してください。これにより AWS SDK for Python (Boto) がインストールされます。

  • 適切なアクセス権限を持つ S3 バケットに保存された、.WAV または .MP4 形式のオーディオファイルを用意する。Amazon 書き起こしに必要なアクセス権限の詳細については、IAM ユーザーロールに必要なアクセス許可。この場所は、呼び出し先のエンドポイントと同じリージョン内に存在する必要があります。この例では、ファイルはという名前の Amazon S3 バケットにあることを前提としています。test-transcribeファイル名はanswer2.wav

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "job name" job_uri = "s3://DOC-EXAMPLE-BUCKET1/key-prefix/file.file-extension" transcribe.start_transcription_job( TranscriptionJobName=job_name, Media={'MediaFileUri': job_uri}, MediaFormat='wav', LanguageCode='en-US' ) while True: status = transcribe.get_transcription_job(TranscriptionJobName=job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

書き起こしジョブが完了すると、結果は JSON 形式の書き起こしを含む Amazon S3 の署名付き URL にリンクされます。

{ "jobName":"job ID", "accountId":"account ID", "results": { "transcripts":[ { "transcript":" that's no answer" } ], "items":[ { "start_time":"0.180", "end_time":"0.470", "alternatives":[ { "confidence":0.84, "word":"that's" } ] }, { "start_time":"0.470", "end_time":"0.710", "alternatives":[ { "confidence":0.99, "word":"no" } ] }, { "start_time":"0.710", "end_time":"1.080", "alternatives":[ { "confidence":0.87, "word":"answer" } ] } ] }, "status":"COMPLETED" }