API d'analyse de texte par lots - Amazon Comprehend Medical

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

API d'analyse de texte par lots

Utilisez Amazon Comprehend Medical pour analyser le texte médical stocké dans un compartiment Amazon S3. Analysez jusqu'à 10 Go de documents en un seul lot. Vous utilisez la console pour créer et gérer des tâches d'analyse par lots, ou vous utilisez des API par lots pour détecter des entités médicales, notamment des informations de santé protégées (PHI). Les API démarrent, arrêtent, répertorient et décrivent les tâches d'analyse par lots en cours.

Les informations tarifaires pour l'analyse des lots et les autres opérations d'Amazon Comprehend Medical sont disponibles ici.

Avis important

Les opérations d'analyse par lots d'Amazon Comprehend Medical ne remplacent pas les conseils, diagnostics ou traitements médicaux professionnels. Déterminez le seuil de confiance approprié pour votre cas et utilisez des seuils de confiance élevés dans les situations qui exigent une grande précision. Dans certains cas d'utilisation, les résultats doivent être examinés et vérifiés par des examinateurs humains dûment formés. Toutes les opérations d'Amazon Comprehend Medical ne doivent être utilisées dans des scénarios de soins aux patients qu'après vérification de leur exactitude et du bon jugement médical par des professionnels de santé qualifiés.

Exécution d'une analyse par lots à l'aide des API

Vous pouvez exécuter une tâche d'analyse par lots à l'aide de la console Amazon Comprehend Medical ou des API Amazon Comprehend Medical Batch.

Prérequis

Lorsque vous utilisez l'API Amazon Comprehend Medical, créez une politique AWS Identity Access and Management (IAM) et associez-la à un rôle IAM. Pour en savoir plus sur les rôles IAM et les politiques de confiance, consultez Politiques et autorisations IAM.

  1. Téléchargez vos données dans un compartiment S3.

  2. Pour démarrer une nouvelle tâche d'analyse, utilisez l'opération StartEntitiesDetection V2Job ou l'opération DetectionJob StartPhi. Lorsque vous démarrez la tâche, indiquez à Amazon Comprehend Medical le nom du compartiment S3 d'entrée contenant les fichiers d'entrée et désignez le compartiment S3 de sortie pour écrire les fichiers après l'analyse par lots.

  3. Surveillez la progression de la tâche à l'aide de la console ou de l'opération DescribeEntitiesDetection V2Job ou de l'opération DetectionJob DescribePhi. En outre, ListEntitiesDetection V2Jobs et ListPhi vous DetectionJobs permettent de voir l'état de toutes les ontologies liant les tâches d'analyse par lots.

  4. Si vous devez arrêter une tâche en cours, utilisez StopEntitiesDetection V2Job ou StopPhi DetectionJob pour arrêter l'analyse.

  5. Pour consulter les résultats de votre tâche d'analyse, consultez le compartiment S3 de sortie que vous avez configuré lorsque vous avez démarré la tâche.

Exécution d'une analyse par lots à l'aide de la console

  1. Téléchargez vos données dans un compartiment S3.

  2. Pour démarrer une nouvelle tâche d'analyse, sélectionnez le type d'analyse que vous allez effectuer. Indiquez ensuite le nom du compartiment S3 contenant les fichiers d'entrée et le nom du compartiment S3 dans lequel vous souhaitez envoyer les fichiers de sortie.

  3. Surveillez le statut de votre travail pendant qu'il est en cours. Depuis la console, vous pouvez consulter toutes les opérations d'analyse par lots et leur statut, y compris les dates de début et de fin de l'analyse.

  4. Pour consulter les résultats de votre tâche d'analyse, consultez le compartiment S3 de sortie que vous avez configuré lorsque vous avez démarré la tâche.

Politiques IAM pour les opérations par lots

Le rôle IAM qui appelle les API batch d'Amazon Comprehend Medical doit disposer d'une politique autorisant l'accès aux compartiments S3 contenant les fichiers d'entrée et de sortie. Il doit également se voir attribuer une relation de confiance permettant au service Amazon Comprehend Medical d'assumer ce rôle. Pour en savoir plus sur les rôles IAM et les politiques de confiance, consultez la section Rôles IAM.

Le rôle doit respecter la politique suivante.

{ "Version": "2012-10-17", "Statement": [ { "Action": [ "s3:GetObject" ], "Resource": [ "arn:aws:s3:::input-bucket/*" ], "Effect": "Allow" }, { "Action": [ "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::input-bucket", "arn:aws:s3:::output-bucket", ], "Effect": "Allow" }, { "Action": [ "s3:PutObject" ], "Resource": [ " arn:aws:s3:::output-bucket/*" ], "Effect": "Allow" } ] }

Le rôle doit avoir la relation de confiance suivante. Il est recommandé d'utiliser les touches de aws:SourceArn condition aws:SourceAccount et pour éviter tout problème de sécurité secondaire confus. Pour en savoir plus sur le problème des députés confus et sur la manière de protéger votre AWS compte, consultez la section Le problème des adjoints confus dans la documentation IAM.

{ "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Principal":{ "Service":[ "comprehendmedical.amazonaws.com" ] }, "Action":"sts:AssumeRole", "Condition": { "StringEquals": { "aws:SourceAccount": "account_id" }, "ArnLike": { "aws:SourceArn": "arn:aws:comprehendmedical:region:account_id:*" } } } ] }

Fichiers de sortie d'analyse par lots

Amazon Comprehend Medical crée un fichier de sortie pour chaque fichier d'entrée du lot. Le fichier possède l'extension.out. Amazon Comprehend Medical crée d'abord un répertoire dans le compartiment S3 de sortie en utilisant AwsAccountIdle nom JobTypeJobId- -, puis écrit tous les fichiers de sortie du lot dans ce répertoire. Amazon Comprehend Medical crée ce nouveau répertoire afin que le résultat d'une tâche ne remplace pas le résultat d'une autre.

La sortie d'une opération par lots produit la même sortie qu'une opération synchrone. Pour des exemples de résultats générés par Amazon Comprehend Medical, Détecter les entités (version 2) consultez.

Chaque opération par lots produit trois fichiers manifestes contenant des informations sur la tâche.

  • Manifest— Résume le travail. Fournit des informations sur les paramètres utilisés pour la tâche, la taille totale de la tâche et le nombre de fichiers traités.

  • success— Fournit des informations sur les fichiers traités avec succès. Inclut le nom du fichier d'entrée et de sortie ainsi que la taille du fichier d'entrée.

  • unprocessed— Répertorie les fichiers que le traitement par lots n'a pas traités, y compris les codes d'erreur et les messages d'erreur par fichier.

Amazon Comprehend Medical écrit les fichiers dans le répertoire de sortie que vous avez spécifié pour le traitement par lots. Le fichier manifeste récapitulatif sera écrit dans le dossier de sortie, avec un dossier intituléManifest_AccountId-Operation-JobId. Le dossier du manifeste contient un success dossier contenant le manifeste de réussite. Un failed dossier contenant le manifeste du fichier non traité est également inclus. Les sections suivantes présentent la structure des fichiers manifestes.

Fichier manifeste Batch

Voici la structure JSON du fichier manifeste par lots.

{"Summary" : {"Status" : "COMPLETED | FAILED | PARTIAL_SUCCESS | STOPPED", "JobType" : "EntitiesDetection | PHIDetection", "InputDataConfiguration" : { "Bucket" : "input bucket", "Path" : "path to files/account ID-job type-job ID" }, "OutputDataConfiguration" : { "Bucket" : "output bucket", "Path" : "path to files" }, "InputFileCount" : number of files in input bucket, "TotalMeteredCharacters" : total characters processed from all files, "UnprocessedFilesCount" : number of files not processed, "SuccessFilesCount" : total number of files processed, "TotalDurationSeconds" : time required for processing, "SuccessfulFilesListLocation" : "path to file", "UnprocessedFilesListLocation" : "path to file", "FailedJobErrorMessage": "error message or if not applicable, The status of the job is completed" } }

Fichier manifeste de réussite

Voici la structure JSON du fichier qui contient des informations sur les fichiers traités avec succès.

{ "Files": [{ "Input": "input path/input file name", "Output": "output path/output file name", "InputSize": size in bytes of input file }, { "Input": "input path/input file name", "Output": "output path/output file name", "InputSize": size in bytes of input file }] }

Fichier manifeste non traité

Voici la structure JSON du fichier manifeste qui contient des informations sur les fichiers non traités.

{ "Files" : [ { "Input": "file_name_that_failed", "ErrorCode": "error code for exception", "ErrorMessage": "explanation of the error code and suggestions" }, { ...} ] }