Analyse asynchrone pour la détection d'événements - Amazon Comprehend

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Analyse asynchrone pour la détection d'événements

Pour détecter des événements dans un ensemble de documents, utilisez le StartEventsDetectionJobpour démarrer une tâche asynchrone.

Avant de commencer

Avant de commencer, assurez-vous que vous disposez des éléments suivants :

  • Compartiments d'entrée et de sortie : identifiez les compartiments Amazon S3 que vous souhaitez utiliser pour les entrées et les sorties. Les buckets doivent se trouver dans la même région que l'API que vous appelez.

  • Rôle de service IAM : vous devez disposer d'un rôle de service IAM autorisé à accéder à vos compartiments d'entrée et de sortie. Pour plus d’informations, consultez Autorisations basées sur les rôles requises pour les opérations asynchrones.

Détectez les événements à l'aide du AWS CLI

L'exemple suivant illustre l'utilisation de l'StartEventsDetectionJobopération avec AWS CLI

L'exemple est mis en forme pour Unix, Linux et macOS. Pour Windows, remplacez le caractère de continuation Unix, à savoir la barre oblique inversée (\), à la fin de chaque ligne par un accent circonflexe (^).

aws comprehend start-events-detection-job \ --region region \ --job-name job name \ --cli-input-json file://path to JSON input file

Pour le cli-input-json paramètre, vous fournissez le chemin d'accès à un fichier JSON contenant les données de demande, comme illustré dans l'exemple suivant.

{ "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role" "LanguageCode": "en", "TargetEventTypes": [ "BANKRUPTCY", "EMPLOYMENT", "CORPORATE_ACQUISITION", "INVESTMENT_GENERAL", "CORPORATE_MERGER", "IPO", "RIGHTS_ISSUE", "SECONDARY_OFFERING", "SHELF_OFFERING", "TENDER_OFFERING", "STOCK_SPLIT" ] }

Si la demande de démarrage de la tâche de détection des événements est réussie, vous recevrez la réponse suivante :

{ "JobStatus": "SUBMITTED", "JobId": "job ID" }

Répertoriez les événements en utilisant AWS CLI

Utilisez cette ListEventsDetectionJobsopération pour voir la liste des tâches de détection d'événements que vous avez soumises. La liste inclut des informations sur les emplacements d'entrée et de sortie que vous avez utilisés et sur l'état de chacune des tâches de détection. L'exemple est mis en forme pour Unix, Linux et macOS. Pour Windows, remplacez le caractère de continuation Unix, à savoir la barre oblique inversée (\), à la fin de chaque ligne par un accent circonflexe (^).

aws comprehend list-events-detection-jobs --region region

Vous obtiendrez un JSON similaire à ce qui suit en réponse :

{ "EventsDetectionJobPropertiesList": [ { "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role", "EndTime": timestamp, "InputDataConfig": { "InputFormat": "ONE_DOC_PER_LINE", "S3Uri": "s3://input bucket/input path" }, "JobId": "job ID", "JobName": "job name", "JobStatus": "COMPLETED", "LanguageCode": "en", "Message": "message", "OutputDataConfig": { "S3Uri": "s3://output bucket/ouput path" }, "SubmitTime": timestamp, "TargetEventTypes": [ "BANKRUPTCY", "EMPLOYMENT", "CORPORATE_ACQUISITION", "INVESTMENT_GENERAL", "CORPORATE_MERGER", "IPO", "RIGHTS_ISSUE", "SECONDARY_OFFERING", "SHELF_OFFERING", "TENDER_OFFERING", "STOCK_SPLIT" ] } ], "NextToken": "next token" }

Décrivez les événements à l'aide du AWS CLI

Vous pouvez utiliser cette DescribeEventsDetectionJobopération pour obtenir le statut d'une tâche existante. L'exemple est mis en forme pour Unix, Linux et macOS. Pour Windows, remplacez le caractère de continuation Unix, à savoir la barre oblique inversée (\), à la fin de chaque ligne par un accent circonflexe (^).

aws comprehend describe-events-detection-job \ --region region \ --job-id job ID

Vous obtiendrez le JSON suivant en réponse :

{ "EventsDetectionJobProperties": { "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role", "EndTime": timestamp, "InputDataConfig": { "InputFormat": "ONE_DOC_PER_LINE", "S3Uri": "S3Uri": "s3://input bucket/input path" }, "JobId": "job ID", "JobName": "job name", "JobStatus": "job status", "LanguageCode": "en", "Message": "message", "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "SubmitTime": timestamp, "TargetEventTypes": [ "BANKRUPTCY", "EMPLOYMENT", "CORPORATE_ACQUISITION", "INVESTMENT_GENERAL", "CORPORATE_MERGER", "IPO", "RIGHTS_ISSUE", "SECONDARY_OFFERING", "SHELF_OFFERING", "TENDER_OFFERING", "STOCK_SPLIT" ] } }

Obtenez les résultats de détection des événements

Voici un exemple de fichier de sortie issu d'une tâche d'analyse qui a détecté des événements dans des documents. Le format de l'entrée est d'un document par ligne.

{"Entities": [{"Mentions": [{"BeginOffset": 12, "EndOffset": 27, "GroupScore": 1.0, "Score": 0.916355, "Text": "over a year ago", "Type": "DATE"}]}, {"Mentions": [{"BeginOffset": 33, "EndOffset": 39, "GroupScore": 1.0, "Score": 0.996603, "Text": "Amazon", "Type": "ORGANIZATION"}]}, {"Mentions": [{"BeginOffset": 66, "EndOffset": 77, "GroupScore": 1.0, "Score": 0.999283, "Text": "Whole Foods", "Type": "ORGANIZATION"}]}], "Events": [{"Arguments": [{"EntityIndex": 2, "Role": "INVESTEE", "Score": 0.999283}, {"EntityIndex": 0, "Role": "DATE", "Score": 0.916355}, {"EntityIndex": 1, "Role": "INVESTOR", "Score": 0.996603}], "Triggers": [{"BeginOffset": 373, "EndOffset": 380, "GroupScore": 0.999984, "Score": 0.999955, "Text": "acquire", "Type": "CORPORATE_ACQUISITION"}], "Type": "CORPORATE_ACQUISITION"}, {"Arguments": [{"EntityIndex": 2, "Role": "PARTICIPANT", "Score": 0.999283}], "Triggers": [{"BeginOffset": 115, "EndOffset": 123, "GroupScore": 1.0, "Score": 0.999967, "Text": "combined", "Type": "CORPORATE_MERGER"}], "Type": "CORPORATE_MERGER"}], "File": "doc.txt", "Line": 0}

Pour plus d'informations sur la structure du fichier de sortie des événements et les types d'événements pris en charge, consultezÉvénements.