를 사용한 Amazon Transcribe 예제 AWS CLI - AWS Command Line Interface

이 설명서는 의 버전 1 AWS CLI 전용입니다. 의 버전 2와 관련된 설명서는 버전 2 사용 설명서 를 AWS CLI참조하세요.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

를 사용한 Amazon Transcribe 예제 AWS CLI

다음 코드 예제에서는 Amazon Transcribe 와 AWS Command Line Interface 함께 를 사용하여 작업을 수행하고 일반적인 시나리오를 구현하는 방법을 보여줍니다.

작업은 대규모 프로그램에서 발췌한 코드이며 컨텍스트에 맞춰 실행해야 합니다. 작업은 개별 서비스 함수를 직접적으로 호출하는 방법을 보여주며 관련 시나리오의 컨텍스트에 맞는 작업을 볼 수 있습니다.

각 예제에는 컨텍스트에서 코드를 설정하고 실행하는 방법에 대한 지침을 찾을 수 있는 전체 소스 코드에 대한 링크가 포함되어 있습니다.

주제

작업

다음 코드 예시에서는 create-language-model을 사용하는 방법을 보여 줍니다.

AWS CLI

예제 1: 훈련 및 튜닝 데이터를 모두 사용하여 사용자 지정 언어 모델을 생성합니다.

다음 create-language-model 예제에서는 사용자 지정 언어 모델을 생성합니다. 사용자 지정 언어 모델을 사용하여 법률, 접객 서비스, 금융 및 보험과 같은 도메인의 트랜스크립션 성능을 개선할 수 있습니다. 언어 코드에 유효한 언어 코드를 입력합니다. 의 경우 base-model-name사용자 지정 언어 모델로 트랜스크립션하려는 오디오의 샘플 속도에 가장 적합한 기본 모델을 지정합니다. 모델 이름에서 사용자 지정 언어 모델을 호출할 이름을 지정합니다.

aws transcribe create-language-model \ --language-code language-code \ --base-model-name base-model-name \ --model-name cli-clm-example \ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-training-data",TuningDataS3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-tuning-data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"

출력:

{ "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }

자세한 내용은 Amazon Transcribe 개발자 안내서사용자 지정 언어 모델을 사용한 도메인별 트랜스크립션 정확도 개선을 참조하세요.

예제 2: 훈련 데이터만 사용하여 사용자 지정 언어 모델을 생성합니다.

다음 create-language-model 예시에서는 오디오 파일을 트랜스크립션합니다. 사용자 지정 언어 모델을 사용하여 법률, 접객 서비스, 금융 및 보험과 같은 도메인의 트랜스크립션 성능을 개선할 수 있습니다. 언어 코드에 유효한 언어 코드를 입력합니다. 의 경우 base-model-name사용자 지정 언어 모델로 트랜스크립션하려는 오디오의 샘플 속도에 가장 적합한 기본 모델을 지정합니다. 모델 이름에서 사용자 지정 언어 모델을 호출할 이름을 지정합니다.

aws transcribe create-language-model \ --language-code en-US \ --base-model-name base-model-name \ --model-name cli-clm-example \ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"

출력:

{ "LanguageCode": "en-US", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data/", "DataAccessRoleArn": "arn:aws:iam::your-AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }

자세한 내용은 Amazon Transcribe 개발자 안내서사용자 지정 언어 모델을 사용한 도메인별 트랜스크립션 정확도 개선을 참조하세요.

  • 자세한 API 내용은 명령 참조CreateLanguageModel의 섹션을 참조하세요. AWS CLI

다음 코드 예시에서는 create-medical-vocabulary을 사용하는 방법을 보여 줍니다.

AWS CLI

의료 사용자 지정 어휘를 생성하려면

다음 create-medical-vocabulary 예시에서는 사용자 지정 어휘를 생성합니다. 사용자 지정 어휘를 생성하려면 더 정확하게 트랜스크립션하려는 모든 용어가 포함된 텍스트 파일을 만들어야 합니다. 에 해당 텍스트 파일의 Amazon Simple Storage Service(Amazon S3)URI를 vocabulary-file-uri지정합니다. language-code의 경우 사용자 지정 어휘의 언어에 해당하는 언어 코드를 지정합니다. vocabulary-name의 경우 사용자 지정 어휘의 이름을 지정합니다.

aws transcribe create-medical-vocabulary \ --vocabulary-name cli-medical-vocab-example \ --language-code language-code \ --vocabulary-file-uri https://DOC-EXAMPLE-BUCKET.AWS-Region.amazonaws.com/the-text-file-for-the-medical-custom-vocabulary.txt

출력:

{ "VocabularyName": "cli-medical-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }

자세한 내용은 Amazon Transcribe 개발자 안내서의료 사용자 지정 어휘를 참조하세요.

다음 코드 예시에서는 create-vocabulary-filter을 사용하는 방법을 보여 줍니다.

AWS CLI

어휘 필터를 생성하려면

다음 create-vocabulary-filter 예제에서는 트랜스크립션에 표시하지 않을 단어 목록이 포함된 텍스트 파일을 사용하는 어휘 필터를 생성합니다. 언어 코드의 경우 어휘 필터의 언어에 해당하는 언어 코드를 지정합니다. 에 텍스트 파일의 Amazon Simple Storage Service(Amazon S3)URI를 vocabulary-filter-file-uri지정합니다. 에서 어휘 필터의 이름을 vocabulary-filter-name지정합니다.

aws transcribe create-vocabulary-filter \ --language-code language-code \ --vocabulary-filter-file-uri s3://DOC-EXAMPLE-BUCKET/vocabulary-filter.txt \ --vocabulary-filter-name cli-vocabulary-filter-example

출력:

{ "VocabularyFilterName": "cli-vocabulary-filter-example", "LanguageCode": "language-code" }

자세한 내용은 Amazon Transcribe 개발자 안내서원치 않는 단어 필터링을 참조하세요.

다음 코드 예시에서는 create-vocabulary을 사용하는 방법을 보여 줍니다.

AWS CLI

사용자 지정 어휘를 생성하는 방법

다음 create-vocabulary 예시에서는 사용자 지정 어휘를 생성합니다. 사용자 지정 어휘를 생성하려면 더 정확하게 트랜스크립션하려는 모든 용어가 포함된 텍스트 파일을 만들어야 합니다. 에 해당 텍스트 파일의 Amazon Simple Storage Service(Amazon S3)URI를 vocabulary-file-uri지정합니다. language-code의 경우 사용자 지정 어휘의 언어에 해당하는 언어 코드를 지정합니다. vocabulary-name의 경우 사용자 지정 어휘의 이름을 지정합니다.

aws transcribe create-vocabulary \ --language-code language-code \ --vocabulary-name cli-vocab-example \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/the-text-file-for-the-custom-vocabulary.txt

출력:

{ "VocabularyName": "cli-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }

자세한 내용은 Amazon Transcribe 개발자 안내서사용자 지정 어휘를 참조하세요.

  • 자세한 API 내용은 명령 참조CreateVocabulary의 섹션을 참조하세요. AWS CLI

다음 코드 예시에서는 delete-language-model을 사용하는 방법을 보여 줍니다.

AWS CLI

사용자 지정 언어 모델을 삭제하려면

다음 delete-language-model 예제에서는 사용자 지정 언어 모델을 삭제합니다.

aws transcribe delete-language-model \ --model-name model-name

이 명령은 출력을 생성하지 않습니다.

자세한 내용은 Amazon Transcribe 개발자 안내서사용자 지정 언어 모델을 사용한 도메인별 트랜스크립션 정확도 개선을 참조하세요.

  • 자세한 API 내용은 명령 참조DeleteLanguageModel의 섹션을 참조하세요. AWS CLI

다음 코드 예시에서는 delete-medical-transcription-job을 사용하는 방법을 보여 줍니다.

AWS CLI

의료 트랜스크립션 작업을 삭제하는 방법

다음 delete-medical-transcription-job 예시에서는 의료 트랜스크립션 작업을 삭제합니다.

aws transcribe delete-medical-transcription-job \ --medical-transcription-job-name medical-transcription-job-name

이 명령은 출력을 생성하지 않습니다.

자세한 내용은 Amazon Transcribe 개발자 안내서DeleteMedicalTranscriptionJob의 섹션을 참조하세요. Amazon Transcribe

다음 코드 예시에서는 delete-medical-vocabulary을 사용하는 방법을 보여 줍니다.

AWS CLI

의료 사용자 지정 어휘를 삭제하려면

다음 delete-medical-vocabulary 예제에서는 의료 사용자 지정 어휘를 삭제합니다. 어휘 이름에 의료 사용자 지정 어휘의 이름을 지정합니다.

aws transcribe delete-vocabulary \ --vocabulary-name medical-custom-vocabulary-name

이 명령은 출력을 생성하지 않습니다.

자세한 내용은 Amazon Transcribe 개발자 안내서의료 사용자 지정 어휘를 참조하세요.

다음 코드 예시에서는 delete-transcription-job을 사용하는 방법을 보여 줍니다.

AWS CLI

트랜스크립션 작업 중 하나를 삭제하는 방법

다음 delete-transcription-job 예시에서는 트랜스크립션 작업 중 하나를 삭제합니다.

aws transcribe delete-transcription-job \ --transcription-job-name your-transcription-job

이 명령은 출력을 생성하지 않습니다.

자세한 내용은 Amazon Transcribe 개발자 안내서DeleteTranscriptionJob의 섹션을 참조하세요. Amazon Transcribe

다음 코드 예시에서는 delete-vocabulary-filter을 사용하는 방법을 보여 줍니다.

AWS CLI

어휘 필터를 삭제하려면

다음 delete-vocabulary-filter 예제에서는 어휘 필터를 삭제합니다.

aws transcribe delete-vocabulary-filter \ --vocabulary-filter-name vocabulary-filter-name

이 명령은 출력을 생성하지 않습니다.

자세한 내용은 Amazon Transcribe 개발자 안내서원치 않는 단어 필터링을 참조하세요.

다음 코드 예시에서는 delete-vocabulary을 사용하는 방법을 보여 줍니다.

AWS CLI

사용자 지정 어휘를 삭제하는 방법

다음 delete-vocabulary 예시에서는 사용자 지정 어휘를 삭제합니다.

aws transcribe delete-vocabulary \ --vocabulary-name vocabulary-name

이 명령은 출력을 생성하지 않습니다.

자세한 내용은 Amazon Transcribe 개발자 안내서사용자 지정 어휘를 참조하세요.

  • 자세한 API 내용은 명령 참조DeleteVocabulary의 섹션을 참조하세요. AWS CLI

다음 코드 예시에서는 describe-language-model을 사용하는 방법을 보여 줍니다.

AWS CLI

특정 사용자 지정 언어 모델에 대한 정보를 가져오려면

다음 describe-language-model 예제에서는 특정 사용자 지정 언어 모델에 대한 정보를 가져옵니다. 예를 들어 아래에서 모델이 NarrowBand 또는 모델을 사용하여 훈련되었는지 여부를 확인할 BaseModelName 수 있습니다 WideBand . NarrowBand 기본 모델이 있는 사용자 지정 언어 모델은 샘플 속도가 16 미만인 오디오를 트랜스크립션할 수 있습니다kHz. WideBand 기본 모델을 사용하는 언어 모델은 샘플 속도가 16보다 큰 오디오를 트랜스크립션할 수 있습니다kHz. S3Uri 파라미터는 사용자 지정 언어 모델을 생성하기 위해 훈련 데이터에 액세스하는 데 사용한 Amazon S3 접두사를 나타냅니다.

aws transcribe describe-language-model \ --model-name cli-clm-example

출력:

{ "LanguageModel": { "ModelName": "cli-clm-example", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" } } }

자세한 내용은 Amazon Transcribe 개발자 안내서사용자 지정 언어 모델을 사용한 도메인별 트랜스크립션 정확도 개선을 참조하세요.

다음 코드 예시에서는 get-medical-transcription-job을 사용하는 방법을 보여 줍니다.

AWS CLI

특정 의료 트랜스크립션 작업에 대한 정보를 얻으려면

다음 get-medical-transcription-job 예제에서는 특정 의료 트랜스크립션 작업에 대한 정보를 가져옵니다. 트랜스크립션 결과에 액세스하려면 TranscriptFileUri 파라미터를 사용합니다. 트랜스크립션 작업에 추가 기능을 활성화한 경우 설정 객체에서 해당 기능을 볼 수 있습니다. 특수 파라미터는 공급자의 의료 전문 분야를 보여줍니다. 유형 파라미터는 트랜스크립션 작업의 스피치가 의학적 대화인지 또는 의학적 지시인지를 나타냅니다.

aws transcribe get-medical-transcription-job \ --medical-transcription-job-name vocabulary-dictation-medical-transcription-job

출력:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "en-US", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://s3.Region.amazonaws.com/Amazon-S3-Prefix/vocabulary-dictation-medical-transcription-job.json" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false, "VocabularyName": "cli-medical-vocab-example" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

자세한 내용은 Amazon Transcribe 개발자 안내서배치 전사를 참조하세요.

다음 코드 예시에서는 get-medical-vocabulary을 사용하는 방법을 보여 줍니다.

AWS CLI

의료 사용자 지정 어휘에 대한 정보를 얻으려면

다음 get-medical-vocabulary 예제에서는 의료 사용자 지정 어휘에 대한 정보를 가져옵니다. VocabularyState 파라미터를 사용하여 어휘의 처리 상태를 볼 수 있습니다. 인 경우 StartMedicalTranscriptionJob 작업에 사용할 READY수 있습니다.

aws transcribe get-medical-vocabulary \ --vocabulary-name medical-vocab-example

출력:

{ "VocabularyName": "medical-vocab-example", "LanguageCode": "en-US", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-medical-custom-vocabulary" }

자세한 내용은 Amazon Transcribe 개발자 안내서의료 사용자 지정 어휘를 참조하세요.

다음 코드 예시에서는 get-transcription-job을 사용하는 방법을 보여 줍니다.

AWS CLI

특정 트랜스크립션 작업에 대한 정보를 가져오려면

다음 get-transcription-job 예시에서는 특정 트랜스크립션 작업에 대한 정보를 가져옵니다. 트랜스크립션 결과에 액세스하려면 TranscriptFileUri 파라미터를 사용합니다. MediaFileUri 파라미터를 사용하여 이 작업으로 복사한 오디오 파일을 확인합니다. Settings 객체를 사용하여 트랜스크립션 작업에서 활성화한 선택적 기능을 확인할 수 있습니다.

aws transcribe get-transcription-job \ --transcription-job-name your-transcription-job

출력:

{ "TranscriptionJob": { "TranscriptionJobName": "your-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "language-code", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://Amazon-S3-file-location-of-transcription-output" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "CompletionTime": "2020-09-18T22:28:21.197000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false }, "IdentifyLanguage": true, "IdentifiedLanguageScore": 0.8672199249267578 } }

자세한 내용은 Amazon Transcribe 개발자 안내서시작하기(AWS 명령줄 인터페이스)를 참조하세요.

  • 자세한 API 내용은 명령 참조GetTranscriptionJob의 섹션을 참조하세요. AWS CLI

다음 코드 예시에서는 get-vocabulary-filter을 사용하는 방법을 보여 줍니다.

AWS CLI

어휘 필터에 대한 정보를 가져오려면

다음 get-vocabulary-filter 예제에서는 어휘 필터에 대한 정보를 가져옵니다. DownloadUri 파라미터를 사용하여 어휘 필터를 생성하는 데 사용한 단어 목록을 가져올 수 있습니다.

aws transcribe get-vocabulary-filter \ --vocabulary-filter-name testFilter

출력:

{ "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00", "DownloadUri": "https://Amazon-S3-location-to-download-your-vocabulary-filter" }

자세한 내용은 Amazon Transcribe 개발자 안내서원치 않는 단어 필터링을 참조하세요.

  • 자세한 API 내용은 명령 참조GetVocabularyFilter의 섹션을 참조하세요. AWS CLI

다음 코드 예시에서는 get-vocabulary을 사용하는 방법을 보여 줍니다.

AWS CLI

사용자 지정 어휘에 대한 정보를 가져오려면

다음 get-vocabulary 예시에서는 이전에 생성한 사용자 지정 어휘에 대한 정보를 가져옵니다.

aws transcribe get-vocabulary \ --vocabulary-name cli-vocab-1

출력:

{ "VocabularyName": "cli-vocab-1", "LanguageCode": "language-code", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:22:32.836000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-custom-vocabulary" }

자세한 내용은 Amazon Transcribe 개발자 안내서사용자 지정 어휘를 참조하세요.

  • 자세한 API 내용은 명령 참조GetVocabulary의 섹션을 참조하세요. AWS CLI

다음 코드 예시에서는 list-language-models을 사용하는 방법을 보여 줍니다.

AWS CLI

사용자 지정 언어 모델을 나열하려면

다음 list-language-models 예제에서는 AWS 계정 및 리전과 연결된 사용자 지정 언어 모델을 나열합니다. S3UriTuningDataS3Uri 파라미터를 사용하여 훈련 데이터 또는 튜닝 데이터로 사용한 Amazon S3 접두사를 찾을 수 있습니다. 는 NarrowBand, 또는 WideBand 모델을 사용하여 사용자 지정 언어 모델을 생성했는지 여부를 BaseModelName 알려줍니다. NarrowBand 기본 모델을 사용하여 사용자 지정 언어 모델을 사용하여 샘플 속도가 16 미만인 오디오 kHz 를 트랜스크립션할 수 있습니다. WideBand 기본 모델을 사용하여 사용자 지정 언어 모델로 오디오 16 kHz 이상을 트랜스크립션할 수 있습니다. ModelStatus 파라미터는 트랜스크립션 작업에서 사용자 지정 언어 모델을 사용할 수 있는지 여부를 보여줍니다. 값이 인 경우 COMPLETED트랜스크립션 작업에 사용할 수 있습니다.

aws transcribe list-language-models

출력:

{ "Models": [ { "ModelName": "cli-clm-2", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-tuning-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "cli-clm-1", "CreateTime": "2020-09-25T17:16:01.835000+00:00", "LastModifiedTime": "2020-09-25T17:16:15.555000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "clm-console-1", "CreateTime": "2020-09-24T19:26:28.076000+00:00", "LastModifiedTime": "2020-09-25T04:25:22.271000+00:00", "LanguageCode": "language-code", "BaseModelName": "NarrowBand", "ModelStatus": "COMPLETED", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } } ] }

자세한 내용은 Amazon Transcribe 개발자 안내서사용자 지정 언어 모델을 사용한 도메인별 트랜스크립션 정확도 개선을 참조하세요.

  • 자세한 API 내용은 명령 참조ListLanguageModels의 섹션을 참조하세요. AWS CLI

다음 코드 예시에서는 list-medical-transcription-jobs을 사용하는 방법을 보여 줍니다.

AWS CLI

의료 트랜스크립션 작업을 나열하는 방법

다음 list-medical-transcription-jobs 예제에서는 AWS 계정 및 리전과 연결된 의료 트랜스크립션 작업을 나열합니다. 특정 트랜스크립션 작업에 대한 자세한 정보를 얻으려면 트랜스크립션 출력에서 MedicalTranscriptionJobName 파라미터 값을 복사하고 get-medical-transcription-job 명령 MedicalTranscriptionJobName 옵션에 해당 값을 지정합니다. 더 많은 트랜스크립션 작업을 보려면 NextToken 파라미터 값을 복사하고 명령을 list-medical-transcription-jobs 다시 실행한 다음 --next-token 옵션에 해당 값을 지정합니다.

aws transcribe list-medical-transcription-jobs

출력:

{ "NextToken": "3/PblzkiGhzjER3KHuQt2fmbPLF7cDYafjFMEoGn44ON/gsuUSTIkGyanvRE6WMXFd/ZTEc2EZj+P9eii/z1O2FDYli6RLI0WoRX4RwMisVrh9G0Kie0Y8ikBCdtqlZB10Wa9McC+ebOl+LaDtZPC4u6ttoHLRlEfzqstHXSgapXg3tEBtm9piIaPB6MOM5BB6t86+qtmocTR/qrteHZBBudhTfbCwhsxaqujHiiUvFdm3BQbKKWIW06yV9b+4f38oD2lVIan+vfUs3gBYAl5VTDmXXzQPBQOHPjtwmFI+IWX15nSUjWuN3TUylHgPWzDaYT8qBtu0Z+3UG4V6b+K2CC0XszXg5rBq9hYgNzy4XoFh/6s5DoSnzq49Q9xHgHdT2yBADFmvFK7myZBsj75+2vQZOSVpWUPy3WT/32zFAcoELHR4unuWhXPwjbKU+mFYfUjtTZ8n/jq7aQEjQ42A+X/7K6JgOcdVPtEg8PlDr5kgYYG3q3OmYXX37U3FZuJmnTI63VtIXsNnOU5eGoYObtpk00Nq9UkzgSJxqj84ZD5n+S0EGy9ZUYBJRRcGeYUM3Q4DbSJfUwSAqcFdLIWZdp8qIREMQIBWy7BLwSdyqsQo2vRrd53hm5aWM7SVf6pPq6X/IXR5+1eUOOD8/coaTT4ES2DerbV6RkV4o0VT1d0SdVX/MmtkNG8nYj8PqU07w7988quh1ZP6D80veJS1q73tUUR9MjnGernW2tAnvnLNhdefBcD+sZVfYq3iBMFY7wTy1P1G6NqW9GrYDYoX3tTPWlD7phpbVSyKrh/PdYrps5UxnsGoA1b7L/FfAXDfUoGrGUB4N3JsPYXX9D++g+6gV1qBBs/WfF934aKqfD6UTggm/zV3GAOWiBpfvAZRvEb924i6yGHyMC7y54O1ZAwSBupmI+FFd13CaPO4kN1vJlth6aM5vUPXg4BpyUhtbRhwD/KxCvf9K0tLJGyL1A==", "MedicalTranscriptionJobSummaries": [ { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "StartTime": "2020-09-21T21:17:27.045000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "StartTime": "2020-09-21T21:01:14.592000+00:00", "CompletionTime": "2020-09-21T21:01:43.606000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "StartTime": "2020-09-21T19:09:18.199000+00:00", "CompletionTime": "2020-09-21T19:10:22.516000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "StartTime": "2020-09-21T18:43:37.265000+00:00", "CompletionTime": "2020-09-21T18:44:21.192000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "StartTime": "2020-09-20T23:46:44.081000+00:00", "CompletionTime": "2020-09-20T23:47:35.851000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } ] }

자세한 내용은 Amazon Transcribe 개발자 안내서의 https://docs.aws.amazon.com/transcribe/최신/dg/batch-med-transcription.html>을 참조하세요.

다음 코드 예시에서는 list-medical-vocabularies을 사용하는 방법을 보여 줍니다.

AWS CLI

의료 사용자 지정 어휘를 나열하려면

다음 list-medical-vocabularies 예제에서는 AWS 계정 및 리전과 연결된 의료 사용자 지정 어휘를 나열합니다. 특정 트랜스크립션 작업에 대한 자세한 내용을 보려면 트랜스크립션 출력에서 MedicalTranscriptionJobName 파라미터 값을 복사하고 get-medical-transcription-job 명령 MedicalTranscriptionJobName 옵션에 해당 값을 지정합니다. 더 많은 트랜스크립션 작업을 보려면 NextToken 파라미터 값을 복사하고 명령을 list-medical-transcription-jobs 다시 실행한 다음 --next-token 옵션에 해당 값을 지정합니다.

aws transcribe list-medical-vocabularies

출력:

{ "Vocabularies": [ { "VocabularyName": "cli-medical-vocab-2", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-21T21:44:59.521000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "cli-medical-vocab-1", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "VocabularyState": "READY" } ] }

자세한 내용은 Amazon Transcribe 개발자 안내서의료 사용자 지정 어휘를 참조하세요.

다음 코드 예시에서는 list-transcription-jobs을 사용하는 방법을 보여 줍니다.

AWS CLI

트랜스크립션 작업을 나열하는 방법

다음 list-transcription-jobs 예제에서는 AWS 계정 및 리전과 연결된 트랜스크립션 작업을 나열합니다.

aws transcribe list-transcription-jobs

출력:

{ "NextToken": "NextToken", "TranscriptionJobSummaries": [ { "TranscriptionJobName": "speak-id-job-1", "CreationTime": "2020-08-17T21:06:15.391000+00:00", "StartTime": "2020-08-17T21:06:15.416000+00:00", "CompletionTime": "2020-08-17T21:07:05.098000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "job-1", "CreationTime": "2020-08-17T20:50:24.207000+00:00", "StartTime": "2020-08-17T20:50:24.230000+00:00", "CompletionTime": "2020-08-17T20:52:18.737000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "sdk-test-job-4", "CreationTime": "2020-08-17T20:32:27.917000+00:00", "StartTime": "2020-08-17T20:32:27.956000+00:00", "CompletionTime": "2020-08-17T20:33:15.126000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "Diarization-speak-id", "CreationTime": "2020-08-10T22:10:09.066000+00:00", "StartTime": "2020-08-10T22:10:09.116000+00:00", "CompletionTime": "2020-08-10T22:26:48.172000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "your-transcription-job-name", "CreationTime": "2020-07-29T17:45:09.791000+00:00", "StartTime": "2020-07-29T17:45:09.826000+00:00", "CompletionTime": "2020-07-29T17:46:20.831000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" } ] }

자세한 내용은 Amazon Transcribe 개발자 안내서시작하기(AWS 명령줄 인터페이스)를 참조하세요.

다음 코드 예시에서는 list-vocabularies을 사용하는 방법을 보여 줍니다.

AWS CLI

사용자 지정 어휘를 나열하는 방법

다음 list-vocabularies 예제에서는 AWS 계정 및 리전과 연결된 사용자 지정 어휘를 나열합니다.

aws transcribe list-vocabularies

출력:

{ "NextToken": "NextToken", "Vocabularies": [ { "VocabularyName": "ards-test-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-27T22:00:27.330000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "sample-test", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T23:04:11.044000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-3-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T22:12:22.277000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-2", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:53:50.455000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-1-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:39:33.356000+00:00", "VocabularyState": "READY" } ] }

자세한 내용은 Amazon Transcribe 개발자 안내서사용자 지정 어휘를 참조하세요.

  • 자세한 API 내용은 명령 참조ListVocabularies의 섹션을 참조하세요. AWS CLI

다음 코드 예시에서는 list-vocabulary-filters을 사용하는 방법을 보여 줍니다.

AWS CLI

어휘 필터를 나열하려면

다음 list-vocabulary-filters 예제에서는 AWS 계정 및 리전과 연결된 어휘 필터를 나열합니다.

aws transcribe list-vocabulary-filters

출력:

{ "NextToken": "NextToken": [ { "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00" }, { "VocabularyFilterName": "testFilter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-21T23:29:35.174000+00:00" }, { "VocabularyFilterName": "filter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-08T20:18:26.426000+00:00" }, { "VocabularyFilterName": "filter-review", "LanguageCode": "language-code", "LastModifiedTime": "2020-06-03T18:52:30.448000+00:00" }, { "VocabularyFilterName": "crlf-filt", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-22T19:42:42.737000+00:00" } ] }

자세한 내용은 Amazon Transcribe 개발자 안내서원치 않는 단어 필터링을 참조하세요.

다음 코드 예시에서는 start-medical-transcription-job을 사용하는 방법을 보여 줍니다.

AWS CLI

예 1: 오디오 파일로 저장된 의료 구술을 트랜스크립션하는 방법

다음 start-medical-transcription-job 예시에서는 오디오 파일을 트랜스크립션합니다. OutputBucketName 파라미터에는 트랜스크립션 출력의 위치를 지정합니다.

aws transcribe start-medical-transcription-job \ --cli-input-json file://myfile.json

myfile.json의 콘텐츠:

{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }

출력:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T00:35:22.256000+00:00", "CreationTime": "2020-09-20T00:35:22.218000+00:00", "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

자세한 내용은 Amazon Transcribe 개발자 안내서배치 트랜스크립션 개요를 참조하세요.

예 2: 오디오 파일로 저장된 의사와 환자 간 대화를 트랜스크립션하는 방법

다음 start-medical-transcription-job 예시에서는 의사와 환자 간 대화가 포함된 오디오 파일을 트랜스크립션합니다. OutputBucketName 파라미터에서 트랜스크립션 출력의 위치를 지정합니다.

aws transcribe start-medical-transcription-job \ --cli-input-json file://mysecondfile.json

mysecondfile.json의 콘텐츠:

{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }

출력:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:19:49.965000+00:00", "CreationTime": "2020-09-20T23:19:49.941000+00:00", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

자세한 내용은 Amazon Transcribe 개발자 안내서배치 트랜스크립션 개요를 참조하세요.

예 3: 의사와 환자 간 대화의 멀티채널 오디오 파일을 트랜스크립션하는 방법

다음 start-medical-transcription-job 예시에서는 오디오 파일에 있는 각 채널의 오디오를 트랜스크립션하고 각 채널의 개별 트랜스크립션을 단일 트랜스크립션 출력으로 병합합니다. OutputBucketName 파라미터에는 트랜스크립션 출력의 위치를 지정합니다.

aws transcribe start-medical-transcription-job \ --cli-input-json file://mythirdfile.json

mythirdfile.json의 콘텐츠:

{ "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ChannelIdentification": true } }

출력:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:46:44.081000+00:00", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "Settings": { "ChannelIdentification": true }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

자세한 내용은 Amazon Transcribe 개발자 안내서채널 식별을 참조하세요.

예 4: 의사와 환자 간 대화의 오디오 파일을 트랜스크립션하고 트랜스크립션 출력에서 화자를 식별하는 방법

다음 start-medical-transcription-job 예시에서는 오디오 파일을 트랜스크립션하고 트랜스크립션 출력에서 각 화자의 음성에 레이블을 지정합니다. OutputBucketName 파라미터에는 트랜스크립션 출력의 위치를 지정합니다.

aws transcribe start-medical-transcription-job \ --cli-input-json file://myfourthfile.json

myfourthfile.json의 콘텐츠:

{ "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }

출력:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T18:43:37.265000+00:00", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

자세한 내용은 Amazon Transcribe 개발자 안내서화자 식별을 참조하세요.

예 5: 최대 두 개의 대체 트랜스크립션을 사용하여 오디오 파일로 저장된 의료 대화를 트랜스크립션하는 방법

다음 start-medical-transcription-job 예시에서는 단일 오디오 파일에서 최대 두 개의 대체 트랜스크립션을 생성합니다. 모든 트랜스크립션에는 신뢰도가 있습니다. 기본적으로 Amazon Transcribe은 신뢰도가 가장 높은 트랜스크립션을 반환합니다. Amazon Transcribe에서 신뢰도가 낮은 추가 트랜스크립션을 반환하도록 지정할 수 있습니다. OutputBucketName 파라미터에는 트랜스크립션 출력의 위치를 지정합니다.

aws transcribe start-medical-transcription-job \ --cli-input-json file://myfifthfile.json

myfifthfile.json의 콘텐츠:

{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }

출력:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T19:09:18.199000+00:00", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

자세한 내용은 Amazon Transcribe 개발자 안내서대체 트랜스크립션을 참조하세요.

예 6: 최대 두 개의 대체 트랜스크립션을 사용하여 의료 구술 오디오 파일을 트랜스크립션하는 방법

다음 start-medical-transcription-job 예시에서는 오디오 파일을 트랜스크립션하고 어휘 필터를 사용하여 원하지 않는 단어를 마스킹합니다. OutputBucketName 파라미터에서 트랜스크립션 출력의 위치를 지정합니다.

aws transcribe start-medical-transcription-job \ --cli-input-json file://mysixthfile.json

mysixthfile.json의 콘텐츠:

{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }

출력:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:01:14.592000+00:00", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

자세한 내용은 Amazon Transcribe 개발자 안내서대체 트랜스크립션을 참조하세요.

예 7: 사용자 지정 어휘로 정확도를 높여 의료 구술 오디오 파일을 트랜스크립션하는 방법

다음 start-medical-transcription-job 예시에서는 오디오 파일을 트랜스크립션하고 이전에 생성한 의료 사용자 지정 어휘를 사용하여 트랜스크립션 정확도를 높입니다. OutputBucketName 파라미터에는 트랜스크립션 출력의 위치를 지정합니다.

aws transcribe start-transcription-job \ --cli-input-json file://myseventhfile.json

mysixthfile.json의 콘텐츠:

{ "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "VocabularyName": "cli-medical-vocab-1" } }

출력:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "Settings": { "VocabularyName": "cli-medical-vocab-1" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

자세한 내용은 Amazon Transcribe 개발자 안내서의료 사용자 지정 어휘를 참조하세요.

다음 코드 예시에서는 start-transcription-job을 사용하는 방법을 보여 줍니다.

AWS CLI

예 1: 오디오 파일을 트랜스크립션하는 방법

다음 start-transcription-job 예시에서는 오디오 파일을 트랜스크립션합니다.

aws transcribe start-transcription-job \ --cli-input-json file://myfile.json

myfile.json의 콘텐츠:

{ "TranscriptionJobName": "cli-simple-transcription-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }

자세한 내용은 Amazon Transcribe 개발자 안내서시작하기(AWS 명령줄 인터페이스)를 참조하세요.

예 2: 다중 채널 오디오 파일을 트랜스크립션하는 방법

다음 start-transcription-job 예시에서는 다중 채널 오디오 파일을 트랜스크립션합니다.

aws transcribe start-transcription-job \ --cli-input-json file://mysecondfile.json

mysecondfile.json의 콘텐츠:

{ "TranscriptionJobName": "cli-channelid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ChannelIdentification":true } }

출력:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-channelid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:07:56.817000+00:00", "CreationTime": "2020-09-17T16:07:56.784000+00:00", "Settings": { "ChannelIdentification": true } } }

자세한 내용은 Amazon Transcribe 개발자 안내서다중 채널 오디오 트랜스크립션을 참조하세요.

예 3: 오디오 파일을 트랜스크립션하고 다른 화자를 식별하는 방법

다음 start-transcription-job 예시에서는 오디오 파일을 트랜스크립션하고 트랜스크립션 출력에서 화자를 식별합니다.

aws transcribe start-transcription-job \ --cli-input-json file://mythirdfile.json

mythirdfile.json의 콘텐츠:

{ "TranscriptionJobName": "cli-speakerid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }

출력:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-speakerid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:22:59.696000+00:00", "CreationTime": "2020-09-17T16:22:59.676000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } } }

자세한 내용은 Amazon Transcribe 개발자 안내서화자 식별을 참조하세요.

예 4: 오디오 파일을 트랜스크립션하고 트랜스크립션 출력에서 원하지 않는 단어를 마스킹하는 방법

다음 start-transcription-job 예시에서는 오디오 파일을 트랜스크립션하고 이전에 생성한 어휘 필터를 사용하여 원하지 않는 단어를 마스킹합니다.

aws transcribe start-transcription-job \ --cli-input-json file://myfourthfile.json

myfourthfile.json의 콘텐츠:

{ "TranscriptionJobName": "cli-filter-mask-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } }

출력:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-mask-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } } }

자세한 내용은 Amazon Transcribe 개발자 안내서트랜스크립션 필터링을 참조하세요.

예 5: 오디오 파일을 트랜스크립션하고 트랜스크립션 출력에서 원하지 않는 단어를 제거하는 방법

다음 start-transcription-job 예시에서는 오디오 파일을 트랜스크립션하고 이전에 생성한 어휘 필터를 사용하여 원하지 않는 단어를 마스킹합니다.

aws transcribe start-transcription-job \ --cli-input-json file://myfifthfile.json

myfifthfile.json의 콘텐츠:

{ "TranscriptionJobName": "cli-filter-remove-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } }

출력:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-remove-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } } }

자세한 내용은 Amazon Transcribe 개발자 안내서트랜스크립션 필터링을 참조하세요.

예 6: 사용자 지정 어휘로 정확도를 높여 오디오 파일을 트랜스크립션하는 방법

다음 start-transcription-job 예시에서는 오디오 파일을 트랜스크립션하고 이전에 생성한 어휘 필터를 사용하여 원하지 않는 단어를 마스킹합니다.

aws transcribe start-transcription-job \ --cli-input-json file://mysixthfile.json

mysixthfile.json의 콘텐츠:

{ "TranscriptionJobName": "cli-vocab-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyName": "your-vocabulary" } }

출력:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-vocab-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyName": "your-vocabulary" } } }

자세한 내용은 Amazon Transcribe 개발자 안내서트랜스크립션 필터링을 참조하세요.

예 7: 오디오 파일의 언어를 식별하고 트랜스크립션하는 방법

다음 start-transcription-job 예시에서는 오디오 파일을 트랜스크립션하고 이전에 생성한 어휘 필터를 사용하여 원하지 않는 단어를 마스킹합니다.

aws transcribe start-transcription-job \ --cli-input-json file://myseventhfile.json

myseventhfile.json의 콘텐츠:

{ "TranscriptionJobName": "cli-identify-language-transcription-job", "IdentifyLanguage": true, "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }

출력:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-identify-language-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "IdentifyLanguage": true } }

자세한 내용은 Amazon Transcribe 개발자 안내서언어 식별을 참조하세요.

예 8: 개인 식별 정보를 수정하여 오디오 파일을 트랜스크립션하는 방법

다음 start-transcription-job 예시에서는 오디오 파일을 트랜스크립션하고 트랜스크립션 출력에서 개인 식별 정보를 수정합니다.

aws transcribe start-transcription-job \ --cli-input-json file://myeighthfile.json

myeigthfile.json의 콘텐츠:

{ "TranscriptionJobName": "cli-redaction-job", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted", "RedactionType":"PII" } }

출력:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:49:13.195000+00:00", "CreationTime": "2020-09-25T23:49:13.176000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted" } } }

자세한 내용은 Amazon Transcribe 개발자 안내서자동 콘텐츠 편집을 참조하세요.

예제 9: 개인 식별 정보(PII)가 편집되고 편집되지 않은 트랜스크립트를 생성하는 방법

다음 start-transcription-job 예시에서는 오디오 파일의 트랜스크립션 두 개를 생성합니다. 하나는 개인 식별 정보를 수정한 것이고 다른 하나는 수정하지 않은 것입니다.

aws transcribe start-transcription-job \ --cli-input-json file://myninthfile.json

myninthfile.json의 콘텐츠:

{ "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted_and_unredacted", "RedactionType":"PII" } }

출력:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:59:47.677000+00:00", "CreationTime": "2020-09-25T23:59:47.653000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted_and_unredacted" } } }

자세한 내용은 Amazon Transcribe 개발자 안내서자동 콘텐츠 편집을 참조하세요.

예 10: 이전에 생성한 사용자 지정 언어 모델을 사용하여 오디오 파일을 트랜스크립션하는 방법

다음 start-transcription-job 예시에서는 이전에 생성한 사용자 지정 언어 모델을 사용하여 오디오 파일을 트랜스크립션합니다.

aws transcribe start-transcription-job \ --cli-input-json file://mytenthfile.json

mytenthfile.json의 콘텐츠:

{ "TranscriptionJobName": "cli-clm-2-job-1", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "ModelSettings": { "LanguageModelName":"cli-clm-2" } }

출력:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-clm-2-job-1", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "StartTime": "2020-09-28T17:56:01.835000+00:00", "CreationTime": "2020-09-28T17:56:01.801000+00:00", "ModelSettings": { "LanguageModelName": "cli-clm-2" } } }

자세한 내용은 Amazon Transcribe 개발자 안내서사용자 지정 언어 모델을 사용한 도메인별 트랜스크립션 정확도 개선을 참조하세요.

다음 코드 예시에서는 update-medical-vocabulary을 사용하는 방법을 보여 줍니다.

AWS CLI

의료 사용자 지정 어휘를 새 용어로 업데이트하는 방법.

다음 update-medical-vocabulary 예제에서는 의료 사용자 지정 어휘에 사용되는 용어를 새 어휘로 바꿉니다. 사전 조건: 의료 사용자 지정 어휘의 용어를 바꾸려면 파일을 새 용어로 바꿔야 합니다.

aws transcribe update-medical-vocabulary \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/medical-custom-vocabulary.txt \ --vocabulary-name medical-custom-vocabulary \ --language-code language

출력:

{ "VocabularyName": "medical-custom-vocabulary", "LanguageCode": "en-US", "VocabularyState": "PENDING" }

자세한 내용은 Amazon Transcribe 개발자 안내서의료 사용자 지정 어휘를 참조하세요.

다음 코드 예시에서는 update-vocabulary-filter을 사용하는 방법을 보여 줍니다.

AWS CLI

어휘 필터의 단어를 바꾸려면

다음 update-vocabulary-filter 예제에서는 어휘 필터의 단어를 새 단어로 바꿉니다. 사전 조건: 어휘 필터를 새 단어로 업데이트하려면 해당 단어를 텍스트 파일로 저장해야 합니다.

aws transcribe update-vocabulary-filter \ --vocabulary-filter-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/your-text-file-to-update-your-vocabulary-filter.txt \ --vocabulary-filter-name vocabulary-filter-name

출력:

{ "VocabularyFilterName": "vocabulary-filter-name", "LanguageCode": "language-code", "LastModifiedTime": "2020-09-23T18:40:35.139000+00:00" }

자세한 내용은 Amazon Transcribe 개발자 안내서원치 않는 단어 필터링을 참조하세요.

다음 코드 예시에서는 update-vocabulary을 사용하는 방법을 보여 줍니다.

AWS CLI

사용자 지정 어휘를 새 용어로 업데이트하는 방법

다음 update-vocabulary 예시에서는 사용자 지정 어휘를 생성하는 데 사용된 용어를 사용자가 제공한 새 용어로 덮어씁니다. 사전 조건: 사용자 지정 어휘의 용어를 바꾸려면 새 용어가 포함된 파일이 필요합니다.

aws transcribe update-vocabulary \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/custom-vocabulary.txt \ --vocabulary-name custom-vocabulary \ --language-code language-code

출력:

{ "VocabularyName": "custom-vocabulary", "LanguageCode": "language", "VocabularyState": "PENDING" }

자세한 내용은 Amazon Transcribe 개발자 안내서사용자 지정 어휘를 참조하세요.

  • 자세한 API 내용은 명령 참조UpdateVocabulary의 섹션을 참조하세요. AWS CLI