PII 非同期分析ジョブ (コンソール) - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

PII 非同期分析ジョブ (コンソール)

コンソールを使用して、PIIエンティティを検出する非同期分析ジョブを作成できます。PII エンティティタイプの詳細については、「」を参照してくださいPII エンティティの検出

分析ジョブを作成するには
  1. にサインインする AWS Management Console で Amazon Comprehend コンソールを開きます。 https://console.aws.amazon.com/comprehend/

  2. 左側のメニューから、[分析ジョブ] を選択し、[ジョブの作成] を選択します。

  3. [ジョブの設定] で、分析ジョブに一意の名前を付けます。

  4. 分析タイプ で個人を特定できる情報 (PII) を選択します。

  5. 言語 で、サポートされている言語 (英語またはスペイン語) のいずれかを選択します。

  6. 出力モード」から、次の選択肢からどれか 1 つを選択します。

    • オフセット — ジョブ出力は各PIIエンティティの場所を返します。

    • 秘匿化 — ジョブ出力は、各PIIエントリが秘匿化された入力テキストのコピーを返します。

  7. (オプション)出力モードとして編集を選択した場合は、編集するPIIエンティティタイプを選択できます。

  8. [入力データ] で、入力文書が Amazon S3 のどこにあるかを指定します。

    • 独自の文書を分析するには、[マイドキュメント] を選択し、[S3 を参照] を選択して、ファイルを含むバケットまたはフォルダへのパスを指定します。

    • Amazon Comprehend が提供するサンプルを分析するには、「サンプル文書」を選択します。この場合、Amazon Comprehend は によって管理されるバケットを使用します。 AWS、および場所は指定しません。

  9. (オプション) [入力フォーマット] では、入力ファイルのフォーマットのいずれかを指定します。

    • 1 ファイルに 1 文書 — 各ファイルには 1 つの入力文書が含まれます。これはサイズの大きいドキュメントのコレクションに最適です。

    • 1 行に 1 文書 — 入力は 1 つ以上のファイルです。ファイル内の各行は 1 つのドキュメントとみなされます。これは、ソーシャルメディアへの投稿など、短いドキュメントに最適です。各行は、ラインフィード (LF、\n)、キャリッジリターン (CR、\r)、またはその両方 (CRLF、\r\n) で終わる必要があります。UTF-8 行区切り文字 (u+2028) を使用して行を終了することはできません。

  10. [出力データ][S3 をブラウズ] を選択します。分析によって生成された出力データを Amazon Comprehend に書き込ませる Amazon S3 バケットまたはフォルダを選択します。

  11. (オプション) ジョブの出力結果を暗号化するには、[暗号化] を選択します。次に、現在のアカウントに関連付けられたKMSキーを使用するか、別のアカウントからキーを使用するかを選択します。

    • 現在のアカウントに関連付けられたキーを使用している場合は、キーエイリアスまたはキー ID の KMS ID を選択します。

    • 別のアカウントに関連付けられたキーを使用している場合は、キーエイリアスまたはキー ID ARNの を入力しますKMS

      注記

      KMS キーの作成と使用、および関連する暗号化の詳細については、「キー管理サービス (KMS)」を参照してください。

  12. アクセス許可 で、次のIAMロールを指定します。

    • 入力文書の Amazon S3 の場所に対する読み取りアクセス権を与えます。

    • 出力文書の Amazon S3 の場所に対する書き込みアクセス権を与えます。

    • comprehend.amazonaws.com サービスプリンシパルがロールを引き受け、アクセス許可を取得することを許可する信頼ポリシーを含む。

    これらのアクセス許可と適切な信頼ポリシーを持つ IAMロールをまだ持っていない場合は、 ロールの作成 IAMを選択してロールを作成します。

  13. フォームの入力が完了したなら、[ジョブの作成] を選択してトピック検出ジョブを作成し、開始します。

新しいジョブがジョブリストに表示され、ステータスフィールドにはジョブのステータスが表示されます。このフィールドは、IN_PROGRESS 処理中のジョブ、COMPLETED 正常に終了したジョブ、FAILED エラーのあるジョブのいずれでもかまいません。ジョブをクリックすると、エラーメッセージを含むそのジョブに関する詳細情報を取得できます。

ジョブが完了すると、Amazon Comprehend は、そのジョブに対して指定した出力用 Amazon S3 の場所に、分析結果を保存します。分析結果の説明については、「PII エンティティの検出」を参照してください。