Aviso importante Realizar el análisis de lotes mediante el APIs Realización de un análisis por lotes mediante la consola Políticas de IAM Archivos de salida de análisis por lotes

Análisis de texto por lotes APIs

Utilice Amazon Comprehend Medical para analizar textos médicos almacenados en un bucket de Amazon S3. Puede analizar hasta 10 GB de documentos en un lote. La consola se utiliza para crear y gestionar trabajos de análisis por lotes o se utiliza por lotes APIs para detectar entidades médicas, incluida la información de salud protegida (PHI). El APIs inicio, la parada, la lista y la descripción de los trabajos de análisis de lotes en curso.

Para ver información sobre precios de análisis por lotes y otras operaciones de Amazon Comprehend Medical, consulte esta página.

Aviso importante

Las operaciones de análisis por lotes de Amazon Comprehend Medical no sustituyen el asesoramiento, el diagnóstico ni el tratamiento médico profesional. Identifique el umbral de confianza adecuado para su caso de uso y utilice umbrales de confianza altos en situaciones que requieran una alta precisión. En ciertos casos de uso, los resultados deberán ser revisados y verificados por revisores humanos debidamente entrenados. Todas las operaciones de Amazon Comprehend Medical solo deben utilizarse en escenarios de atención al paciente después de que un profesional médico debidamente formado haya revisado su exactitud y buen juicio médico.

Realizar el análisis de lotes mediante el APIs

Puede ejecutar un trabajo de análisis por lotes mediante la consola Amazon Comprehend Medical o Amazon Comprehend APIs Medical Batch.

Requisitos previos

Cuando utilice la API de Amazon Comprehend Medical, cree una política de AWS Identity Access and Management (IAM) y asóciela a un rol de IAM. Para obtener más información sobre las políticas de confianza y los roles de IAM, consulte Políticas y permisos de IAM.

Cargue sus datos en un bucket de S3.
Para iniciar un nuevo trabajo de análisis, utilice la operación StartEntitiesDetection V2Job o la operación Start PHIDetection Job. Cuando inicie el trabajo, indique a Amazon Comprehend Medical el nombre del bucket de S3 que contiene los archivos de entrada y designe el bucket de salida de S3 donde se escribirán los archivos tras realizar el análisis por lotes.
Supervise el progreso del trabajo mediante la consola o la operación DescribeEntitiesDetection V2Job o la operación Describe PHIDetection Job. Además, ListEntitiesDetection V2Jobs y List PHIDetection Jobs permiten ver el estado de todas las ontologías que vinculan los trabajos de análisis por lotes.
Si necesita detener un trabajo en curso, utilice StopEntitiesDetection V2Job o Stop Job para detener el análisis. PHIDetection
Para ver los resultados de un trabajo de análisis, consulte el bucket de salida de S3 que configuró al iniciar el trabajo.

Realización de un análisis por lotes mediante la consola

Cargue sus datos en un bucket de S3.
Para iniciar un nuevo trabajo, seleccione el tipo de análisis que va a realizar. A continuación, indique el nombre del bucket de S3 que contiene los archivos de entrada y el nombre del bucket de S3 donde desea enviar los archivos de salida.
Monitorice el estado del trabajo mientras está en marcha. En la consola puede ver todas las operaciones de análisis por lotes y su estado, incluido el momento en que se inició y finalizó el análisis.
Para ver los resultados de un trabajo de análisis, consulte el bucket de S3 de salida que configuró al iniciar el trabajo.

Políticas de IAM para operaciones por lotes

La función de IAM que denomina lote Amazon Comprehend Medical APIs debe tener una política que conceda acceso a los depósitos S3 que contienen los archivos de entrada y salida. También se le debe asignar una relación de confianza que permita al servicio Amazon Comprehend Medical asumir ese rol. Para obtener más información sobre las políticas de confianza y los roles de IAM, consulte Roles de IAM.

El rol debe tener la siguiente política de IAM.

El rol debe tener la siguiente relación de confianza. Se recomienda utilizar las claves de condición aws:SourceAccount y aws:SourceArn para evitar el problema de seguridad del suplente confuso. Para obtener más información sobre el problema del diputado confuso y sobre cómo proteger su AWS cuenta, consulte El problema del diputado confuso en la documentación de IAM.

Archivos de salida de análisis por lotes

Amazon Comprehend Medical crea un archivo de salida para cada archivo de entrada de un lote. Este archivo tiene la extensión .out. Amazon Comprehend Medical crea primero un directorio en el bucket S3 de salida con AwsAccountId el nombre JobType JobId - - y, a continuación, escribe todos los archivos de salida del lote en este directorio. Amazon Comprehend Medical crea este nuevo directorio para que los datos de salida de un trabajo no sobrescriban los de otro.

La salida de una operación por lotes es igual a la de una operación sincrónica. Para ver ejemplos de la salida generada por Amazon Comprehend Medical, consulte Detección de entidades (versión 2).

Cada operación por lotes produce tres archivos de manifiesto que contienen información sobre el trabajo.

Manifest: ofrece un resumen del trabajo. Proporciona información sobre los parámetros utilizados, el tamaño total del trabajo y el número de archivos procesados.
success: proporciona información sobre los archivos que se han procesado correctamente. Incluye el nombre de los archivos de entrada y de salida, y el tamaño del archivo de entrada.
unprocessed: muestra los archivos que el trabajo por lotes no procesó, incluidos códigos de error y mensajes de error por archivo.

Amazon Comprehend Medical escribe los archivos en el directorio de salida que especificó para el trabajo por lotes. El archivo de manifiesto de resumen se escribirá en la carpeta de salida, junto con una carpeta titulada Manifest_AccountId-Operation-JobId. Dentro de la carpeta del manifiesto hay una carpeta success que contiene el manifiesto de los archivos procesados. También se incluye una carpeta failed que contiene el manifiesto de los archivos sin procesar. En las secciones siguientes se muestra la estructura de archivos de manifiesto.

Archivo de manifiesto de procesamiento por lotes

Esta es la estructura JSON del archivo de manifiesto por lotes:


{"Summary" : 
    {"Status" : "COMPLETED | FAILED | PARTIAL_SUCCESS | STOPPED", 
    "JobType" : "EntitiesDetection | PHIDetection", 
    "InputDataConfiguration" : {
        "Bucket" : "input bucket", 
        "Path" : "path to files/account ID-job type-job ID" 
    }, "OutputDataConfiguration" : {
        "Bucket" : "output bucket", 
        "Path" : "path to files" 
    }, 
    "InputFileCount" : number of files in input bucket, 
    "TotalMeteredCharacters" : total characters processed from all files, 
    "UnprocessedFilesCount" : number of files not processed, 
    "SuccessFilesCount" : total number of files processed, 
    "TotalDurationSeconds" : time required for processing, 
    "SuccessfulFilesListLocation" : "path to file", 
    "UnprocessedFilesListLocation" : "path to file",
    "FailedJobErrorMessage": "error message or if not applicable,
              The status of the job is completed"
    } 
}

Archivo de manifiesto de los archivos procesados

Esta es la estructura JSON del archivo que contiene información sobre los archivos procesados correctamente:


{
        "Files": [{
               "Input": "input path/input file name",
               "Output": "output path/output file name",
               "InputSize": size in bytes of input file
        }, {
               "Input": "input path/input file name",
               "Output": "output path/output file name",
               "InputSize": size in bytes of input file
        }]
}

Archivo de manifiesto de los archivos no procesados

Esta es la estructura JSON del archivo de manifiesto que contiene información sobre los archivos no procesados:


{
  "Files" : [ {
      "Input": "file_name_that_failed",
      "ErrorCode": "error code for exception",
      "ErrorMessage": "explanation of the error code and suggestions"
  }, 
  { ...}
  ]
}

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Detección de información sanitaria protegida (PHI)

Vinculación de ontologías APIs