トピックモデリングの非同期分析 - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

トピックモデリングの非同期分析

ドキュメントセット内のトピックを確認するには、 StartTopicsDetectionJob を使用して非同期ジョブを開始します。英語またはスペイン語のドキュメントのトピックを監視できます。

開始する前に

このチュートリアルを開始する前に、以下の要件を満たしていることを確認してください。

  • 入出力バケット — 入出力に使用する Amazon S3 バケットを指定します。バケットは、呼び出す API と同じリージョンに存在している必要があります。

  • IAM サービスロール — 入出力バケットにアクセス許可を持つ IAM サービスロールが必要です。詳細については、「バッチ操作に必要なロールベースのアクセス許可」を参照してください。

AWS Command Line Interface の使用

以下は、AWS CLI での StartTopicsDetectionJob オペレーションの使用例です。

例は、Unix、Linux、および macOS 用にフォーマットされています。Windows の場合は、各行末のバックスラッシュ (\) Unix 連結文字をキャレット (^) に置き換えてください。

aws comprehend start-topics-detection-job \ --number-of-topics topics to return \ --job-name "job name" \ --region region \ --cli-input-json file://path to JSON input file

次の例に示すように、cli-input-json パラメータには、リクエストデータを含む JSON ファイルへのパスを指定します。

{ "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role" }

トピック検出ジョブの開始リクエストが成功すると、以下のようなレスポンスが返されます。

{ "JobStatus": "SUBMITTED", "JobId": "job ID" }

ListTopicsDetectionJobs オペレーションを使用して、送信したトピック検出ジョブのリストを表示します。このリストには、使用された入力および出力の場所、各検出ジョブのステータスに関する情報が含まれます 例は、Unix、Linux、および macOS 用にフォーマットされています。Windows の場合は、各行末のバックスラッシュ (\) Unix 連結文字をキャレット (^) に置き換えてください。

aws comprehend list-topics-detection-jobs \-- region

レスポンスには、次のような JSON が返されます。

{ "TopicsDetectionJobPropertiesList": [ { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "EndTime": timestamp }, { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "RUNNING", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" } } ] }

DescribeTopicsDetectionJob オペレーションを使用して、既存のジョブのステータスを取得できます。例は、Unix、Linux、および macOS 用にフォーマットされています。Windows の場合は、各行末のバックスラッシュ (\) Unix 連結文字をキャレット (^) に置き換えてください。

aws comprehend describe-topics-detection-job --job-id job ID

レスポンスには、次のような JSON が返されます。

{ "TopicsDetectionJobProperties": { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/ouput path" }, "EndTime": timestamp } }

SDK for Python または AWS SDK for .NET を使用する場合

トピックモデリングジョブの開始方法を示す SDK の例については、「StartTopicsDetectionJob で を使用する AWS SDK または CLI」を参照してください。