Cómo identificar los idiomas en el audio multilingüe Mejora de la precisión de la identificación de idiomas Combinar la identificación del idioma con otras características de Amazon Transcribe Utilizar la identificación de idiomas con transcripciones por lotes

Identificación de idiomas con trabajos de transcripción por lotes

Utilice la identificación de idioma por lotes para identificar automáticamente el idioma o los idiomas del archivo multimedia.

Si el contenido multimedia contiene un único idioma, puede activar la identificación en un sólo idioma, que identifica el idioma dominante que se habla en el archivo multimedia y crea la transcripción utilizando únicamente este idioma.

Si el contenido multimedia contiene más de un idioma, puede habilitar la identificación en varios idiomas, que identifica todos los idiomas que se hablan en el archivo multimedia y crea la transcripción utilizando únicamente este idioma. Tenga en cuenta que se produce una transcripción multilingüe. Puede utilizar otros servicios, por ejemplo Amazon Translate, para traducir su expediente académico.

Consulte la tabla de idiomas admitidos para obtener una lista completa de los idiomas admitidos y los códigos de idioma asociados.

Para obtener los mejores resultados, asegúrese de que el archivo multimedia contenga al menos 30 segundos de voz.

Para ver ejemplos de uso con AWS Management Console AWS CLI, y el SDK de AWS Python, consulteUtilizar la identificación de idiomas con transcripciones por lotes.

Cómo identificar los idiomas en el audio multilingüe

La identificación multilingüe está pensada para archivos multimedia multilingües y le proporciona una transcripción que refleja todos los idiomas admitidos que se hablan en sus archivos multimedia. Esto significa que si los hablantes cambian de idioma a mitad de la conversación, o si cada participante habla un idioma diferente, el resultado de la transcripción detectará y transcribirá cada idioma correctamente. Por ejemplo, si su contenido multimedia contiene un hablante bilingüe que alterna entre el inglés estadounidense (en-US) y el hindi (hi-IN), la identificación multilingüe puede identificar y transcribir el inglés estadounidense hablado como en-US y el hindi hablado como hi-IN.

Esto difiere de la identificación en un único idioma, en la que sólo se usa un idioma dominante para crear una transcripción. En este caso, cualquier idioma hablado que no sea el idioma dominante se transcribe incorrectamente.

nota

Los modelos lingüísticos personalizados y de redacción no son compatibles actualmente con la identificación en varios idiomas.

nota

Actualmente, se admiten los siguientes idiomas con identificación multilingüe: en-AB, en-AU, en-GB, en-IE, en-IN, en-IN, en-NZ, en-US, en-WL, en-ZA, es-ES, es-US, fr-CA, fr-FR, zh-CN, zh-TW, pt-BR, pt-PT, de-CH, de-DE, af-ZA, ar-AE, da-DK, he-IL, Hi-in, ID-ID, Fa-ir, es-it, ja-JP, ko-KR, MS-my, NL-NL, ru-RU, Ta-in, Te-in, Th-th, TR-TR

Las transcripciones multilingües proporcionan un resumen de los idiomas detectados y del tiempo total que se habla cada idioma en el contenido multimedia. A continuación se muestra un ejemplo:


"results": {
        "transcripts": [
            {
                "transcript": "welcome to Amazon transcribe. ये तो उदाहरण हैं क्या कैसे कर सकते हैं ।一つのファイルに複数の言語を書き写す"
            }
        ],

    ...

        "language_codes": [
            {
                "language_code": "en-US",
                "duration_in_seconds": 2.45
            },
            {
                "language_code": "hi-IN",
                "duration_in_seconds": 5.325
            },
            {
                "language_code": "ja-JP",
                "duration_in_seconds": 4.15
            }
        ]
}

Mejora de la precisión de la identificación de idiomas

Con la identificación de idiomas, tiene la opción de incluir una lista de los idiomas que cree que pueden estar presentes en sus archivos multimedia. La inclusión de opciones de idioma (LanguageOptions) restringe Amazon Transcribe el uso exclusivo de los idiomas que especifique al hacer coincidir el audio con el idioma correcto, lo que puede acelerar la identificación del idioma y mejorar la precisión asociada a la asignación del dialecto correcto.

Si decide incluir códigos de idioma, debe incluir al menos dos. No hay límite en la cantidad de códigos de idioma que puede incluir, pero le recomendamos usar entre dos y cinco para lograr una eficiencia y precisión óptimas.

nota

Si incluye códigos de idioma en su solicitud y ninguno de los códigos de idioma que proporciona coincide con el idioma o los idiomas identificados en el audio, Amazon Transcribe selecciona el idioma que más coincida entre los códigos de idioma especificados. A continuación, produce una transcripción en ese idioma. Por ejemplo, si el contenido multimedia está en inglés estadounidense (en-US) y usted proporciona los códigos de idiomazh-CN, y fr-FRde-DE, Amazon Transcribe es probable que haga coincidir el contenido Amazon Transcribe con el alemán (de-DE) y produzca una transcripción en alemán. Si los códigos de idioma y los idiomas hablados no coinciden, es posible que la transcripción sea imprecisa, por lo que recomendamos tener cuidado al incluir los códigos de idioma.

Combinar la identificación del idioma con otras características de Amazon Transcribe

Puede utilizar la identificación de idioma por lotes en combinación con cualquier otra característica de Amazon Transcribe . Si combina la identificación de idiomas con otras características, usted está limitado a los idiomas compatibles con esas características. Por ejemplo, si utilizas la identificación lingüística para redactar el contenido, estás limitado al inglés estadounidense (en-US) o al español estadounidense (es-US), ya que este es el único idioma disponible para la redacción. Para obtener más información, consulte Idiomas compatibles y características específicas de cada idioma.

importante

Si utilizas la identificación automática del idioma con la redacción de contenido habilitada y tu audio contiene idiomas distintos del inglés estadounidense (en-US) o el español de EE. UU. (es-US), en tu transcripción solo aparecerá redactado el contenido en inglés o español de EE. UU. No se puede redactar en otros idiomas y no hay advertencias ni errores en el trabajo.

Modelos de idioma personalizados, vocabularios personalizados y filtros de vocabulario personalizados

Si desea agregar uno o más modelos de idioma personalizados, vocabularios personalizados o filtros de vocabulario personalizados a su solicitud de identificación de idioma, debe incluir el parámetro LanguageIdSettings. A continuación, puede especificar un código de idioma con el modelo de idioma personalizado, el vocabulario personalizado y el filtro de vocabulario personalizado correspondientes. Tenga en cuenta que la identificación multilingüe no admite modelos de idioma personalizados.

Se recomienda incluir LanguageOptions cuando utilice LanguageIdSettings para asegurarse de que se identifica el dialecto correcto. Por ejemplo, si especificas un vocabulario en-US personalizado, pero Amazon Transcribe determinas que es el idioma que se habla en el contenido multimediaen-AU, ese vocabulario personalizado no se aplicará a la transcripción. Si incluye LanguageOptions y especifica en-US como el único dialecto del idioma inglés, su vocabulario personalizado se aplicará a la transcripción.

Para ver ejemplos de LanguageIdSettingsuna solicitud, consulta la opción 2 en los paneles AWS SDKsdesplegables AWS CLIy desplegables de la Utilizar la identificación de idiomas con transcripciones por lotes sección.

Utilizar la identificación de idiomas con transcripciones por lotes

Puede utilizar la identificación automática del idioma en un trabajo de transcripción por lotes utilizando las AWS Management Consoleteclas AWS CLI,, o AWS SDKs; consulte los ejemplos siguientes:

Inicie sesión en la AWS Management Console.
En el panel de navegación, elija Trabajos de transcripción y, a continuación, seleccione Crear trabajo (arriba a la derecha). Se abrirá la página Especificar los detalles del trabajo.
En el panel de Configuración del trabajo, busque la sección Configuración de idioma y seleccione Identificación automática de idioma o Identificación automática de varios idiomas.

Tiene la opción de seleccionar varias opciones de idioma (en el cuadro desplegable Seleccionar idiomas) si conoce qué idiomas están presentes en su archivo de audio. Proporcionar las opciones del idioma puede mejorar la precisión, pero no es obligatorio.
Rellene todos los campos que desee incluir en la página Especificar los detalles del trabajo y, a continuación, seleccione Siguiente. Esto lo llevará a la página Configurar trabajo: opcional.
Seleccione Crear trabajo para ejecutar su trabajo de transcripción.

En este ejemplo se utilizan el start-transcription-jobcomando y IdentifyLanguage el parámetro. Para obtener más información, consulte StartTranscriptionJob y LanguageIdSettings.

Opción 1: sin el parámetro language-id-settings. Utilice esta opción si no incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud. language-options es opcional, pero recomendable.


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \    
--identify-language \  (or --identify-multiple-languages) \
--language-options "en-US" "hi-IN"

Opción 2: sin el parámetro language-id-settings. Utilice esta opción si incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud.


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--identify-language \  (or --identify-multiple-languages)
--language-options "en-US" "hi-IN" \
--language-id-settings en-US=VocabularyName=my-en-US-vocabulary,en-US=VocabularyFilterName=my-en-US-vocabulary-filter,en-US=LanguageModelName=my-en-US-language-model,hi-IN=VocabularyName=my-hi-IN-vocabulary,hi-IN=VocabularyFilterName=my-hi-IN-vocabulary-filter

A continuación, se muestra otro ejemplo en el que se utiliza el start-transcription-jobcomando y el cuerpo de la solicitud que identifica el idioma.


aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-language-id-job.json

El archivo my-first-language-id-job.json contiene el siguiente cuerpo de solicitud.

Opción 1: sin el parámetro LanguageIdSettings. Utilice esta opción si no incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud. LanguageOptions es opcional, pero recomendable.


{
  "TranscriptionJobName": "my-first-transcription-job",  
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "IdentifyLanguage": true,  (or "IdentifyMultipleLanguages": true),
  "LanguageOptions": [
        "en-US", "hi-IN"  
  ]
}

Opción 2: sin el parámetro LanguageIdSettings. Utilice esta opción si incluye un modelo de idioma personalizado, un vocabulario personalizado o un filtro de vocabulario personalizado en su solicitud.


{
   "TranscriptionJobName": "my-first-transcription-job",  
   "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
   "OutputBucketName": "amzn-s3-demo-bucket",
   "OutputKey": "my-output-files/", 
   "IdentifyLanguage": true,  (or "IdentifyMultipleLanguages": true)
   "LanguageOptions": [
        "en-US", "hi-IN"  
   ],
   "LanguageIdSettings": { 
         "en-US" : { 
            "LanguageModelName": "my-en-US-language-model",
            "VocabularyFilterName": "my-en-US-vocabulary-filter",
            "VocabularyName": "my-en-US-vocabulary"
         },
         "hi-IN": {
             "VocabularyName": "my-hi-IN-vocabulary",
             "VocabularyFilterName": "my-hi-IN-vocabulary-filter"
         }
    }
}

En este ejemplo, se utiliza AWS SDK para Python (Boto3) para identificar el idioma del archivo mediante el IdentifyLanguage argumento del método start_transcription_job. Para obtener más información, consulte StartTranscriptionJob y LanguageIdSettings.

Para ver más ejemplos en los que se utiliza el escenario y los servicios cruzados AWS SDKs, incluidos ejemplos de funciones específicas, consulte el capítulo. Ejemplos de código para Amazon Transcribe usando AWS SDKs


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/',
    MediaFormat = 'flac',
    IdentifyLanguage = True,  (or IdentifyMultipleLanguages = True),
    LanguageOptions = [
        'en-US', 'hi-IN'
    ]
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    MediaFormat='flac',
    IdentifyLanguage=True,  (or IdentifyMultipleLanguages=True)
    LanguageOptions = [
        'en-US', 'hi-IN'
    ],
    LanguageIdSettings={
        'en-US': {
            'VocabularyName': 'my-en-US-vocabulary',
            'VocabularyFilterName': 'my-en-US-vocabulary-filter',
            'LanguageModelName': 'my-en-US-language-model'
        },
        'hi-IN': {
            'VocabularyName': 'my-hi-IN-vocabulary',
            'VocabularyFilterName': 'my-hi-IN-vocabulary-filter'
        }   
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Identificación de idiomas

Identificación del idioma en streaming