翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ステップ 1: Amazon S3 にドキュメントを追加する
データセットで Amazon Comprehend エンティティ分析ジョブを実行する前に、データ、メタデータ、および Amazon Comprehend エンティティ分析出力をホストする Amazon S3 バケットを作成します。
サンプルデータセットをダウンロードする
Amazon Comprehend がデータに対してエンティティ分析ジョブを実行できるようにするには、データセットをダウンロードして抽出し、S3 バケットにアップロードする必要があります。
-
デバイス上の tutorial-dataset.zip フォルダをダウンロードします。
-
tutorial-dataset
フォルダを抽出してdata
フォルダにアクセスします。
-
tutorial-dataset
をダウンロードするには、ターミナルウィンドウを開き、以下のコマンドを実行します。 -
zip フォルダからデータを抽出するには、ターミナルウィンドウで次のコマンドを実行します。
このステップを完了すると、抽出されたファイルが tutorial-dataset
という解凍したフォルダにあるはずです。このフォルダには、Apache 2.0 オープンソースのアトリビューションのある README
ファイルと、このチュートリアルのデータセットが含まれている data
というフォルダがあります。データセットは .story
拡張子のある 100 個のファイルで構成されます。
Amazon S3 バケットの作成
サンプルデータフォルダをダウンロードして抽出したら、Amazon S3 バケットに保存します。
重要
Amazon S3 バケットの名前はすべての AWS全体で一意である必要があります。
にサインイン AWS Management Console し、 で Amazon S3 コンソールを開きますhttps://console.aws.amazon.com/s3/
。 -
[Buckets] (バケット) で、[Create bucket] (バケットの作成) を選択します。
-
[Bucket name] (バケット名) に、一意の名前を入力します。
-
リージョン で、バケットを作成する AWS リージョンを選択します。
注記
Amazon Comprehend と Amazon Kendra の両方をサポートするリージョンを選択する必要があります。作成後にバケットのリージョンを変更することはできません。
-
[Block Public Access settings for this bucket] (このバケットのパブリックアクセス設定をブロックする)、[Bucket Versioning] (バケットバージョニング)、および [Tags] (タグ) はデフォルト設定のままにしておきます。
-
[Default encryption] (デフォルトの暗号化) には、[Disable] (無効) を選択します。
-
[Advanced settings] (詳細設定) はデフォルト設定のままにしておきます。
-
バケットの設定を確認して、[Create bucket] (バケットの作成) を選択します。
-
S3 バケットを作成するには、 AWS CLIで [create-bucket]
コマンドを使用します。 注記
Amazon Comprehend と Amazon Kendra の両方をサポートするリージョンを選択する必要があります。作成後にバケットのリージョンを変更することはできません。
-
バケットが正常に作成されたことを確認するには、[list]
コマンドを使用します。
S3 バケットにデータフォルダとメタデータフォルダを作成する
S3 バケットを作成した後、その中のフォルダにデータフォルダとメタデータフォルダを作成します。
で Amazon S3 コンソールを開きますhttps://console.aws.amazon.com/s3/
。 -
[Buckets] (バケット) で、バケットのリストからバケットの名前をクリックします。
-
[Objects] (オブジェクト) タブから、[Create folder] (フォルダの作成) を選択します。
-
新しいフォルダ名に、
data
を入力します。 -
暗号化設定については、[Disable] (無効) を選択します。
-
[Create folder] (フォルダの作成) を選択します。
-
ステップ 3 から 6 を繰り返して Amazon Kendra メタデータを保存する別のフォルダーを作成し、ステップ 4
metadata
で作成したフォルダに名前を付けます。
-
S3 バケットで
data
フォルダを作成するには、 AWS CLIで [put-object]コマンドを使用します。 -
S3 バケットで
metadata
フォルダを作成するには、 AWS CLIで [put-object]コマンドを使用します。 -
フォルダが正常に作成されたことを確認するには、[list]
コマンドを使用してバケットの内容をチェックします。
入力データをアップロードする
データフォルダとメタデータフォルダを作成したら、サンプルデータセットを data
フォルダにアップロードします。
で Amazon S3 コンソールを開きますhttps://console.aws.amazon.com/s3/
。 -
[Buckets] (バケット) で、バケットのリストからバケットの名前、
data
の順にクリックします。 -
[Upload] (アップロード)、[Add files] (ファイルの追加) の順に選択します。
-
ダイアログボックスで、ローカルデバイスの
tutorial-dataset
フォルダ内のdata
フォルダで、すべてのファイルを選択し、[Open] (開く) をクリックします。 -
[Destination] (送信先)、[Permissions] (アクセス許可)、および [Properties] (プロパティ) はデフォルト設定のままにしておきます。
-
[Upload] (アップロード) を選択します。
このステップを完了すると、data
フォルダに S3 バケットのデータセットが保存されされた、metadata
フォルダが空になります。このフォルダは Amazon Kendra メタデータを保存します。