サンプルデータセットをダウンロードする Amazon S3 バケットの作成 S3 バケットにデータフォルダとメタデータフォルダを作成する入力データをアップロードする

ステップ 1: Amazon S3 にドキュメントを追加する

データセットで Amazon Comprehend エンティティ分析ジョブを実行する前に、データ、メタデータ、および Amazon Comprehend エンティティ分析出力をホストする Amazon S3 バケットを作成します。

トピック

サンプルデータセットをダウンロードする
Amazon S3 バケットの作成
S3 バケットにデータフォルダとメタデータフォルダを作成する
入力データをアップロードする

サンプルデータセットをダウンロードする

Amazon Comprehend がデータに対してエンティティ分析ジョブを実行できるようにするには、データセットをダウンロードして抽出し、S3 バケットにアップロードする必要があります。

デバイス上の tutorial-dataset.zip フォルダをダウンロードします。
tutorial-dataset フォルダを抽出して data フォルダにアクセスします。

tutorial-dataset をダウンロードするには、ターミナルウィンドウを開き、以下のコマンドを実行します。
Linux
```
curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
```
コードの説明は以下のとおりです。
path/ は、zip フォルダを保存する場所へのローカルファイルパスです。
macOS
```
curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
```
コードの説明は以下のとおりです。
path/ は、zip フォルダを保存する場所へのローカルファイルパスです。
Windows
```
curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
```
コードの説明は以下のとおりです。
path/ は、zip フォルダを保存する場所へのローカルファイルパスです。
zip フォルダからデータを抽出するには、ターミナルウィンドウで次のコマンドを実行します。
Linux
```
unzip path/tutorial-dataset.zip -d path/
```
コードの説明は以下のとおりです。
path/ は、保存した zip フォルダへのローカルファイルパスです。
macOS
```
unzip path/tutorial-dataset.zip -d path/
```
コードの説明は以下のとおりです。
path/ は、保存した zip フォルダへのローカルファイルパスです。
Windows
```
tar -xf path/tutorial-dataset.zip -C path/
```
コードの説明は以下のとおりです。
path/ は、保存した zip フォルダへのローカルファイルパスです。

このステップを完了すると、抽出されたファイルが tutorial-dataset という解凍したフォルダにあるはずです。このフォルダには、Apache 2.0 オープンソースのアトリビューションのある README ファイルと、このチュートリアルのデータセットが含まれている data というフォルダがあります。データセットは .story 拡張子のある 100 個のファイルで構成されます。

Amazon S3 バケットの作成

サンプルデータフォルダをダウンロードして抽出したら、Amazon S3 バケットに保存します。

重要

Amazon S3 バケットの名前はすべての AWS全体で一意である必要があります。

にサインイン AWS Management Console し、で Amazon S3 コンソールを開きますhttps://console.aws.amazon.com/s3/。
[Buckets] (バケット) で、[Create bucket] (バケットの作成) を選択します。
[Bucket name] (バケット名) に、一意の名前を入力します。
リージョン で、バケットを作成する AWS リージョンを選択します。

注記
Amazon Comprehend と Amazon Kendra の両方をサポートするリージョンを選択する必要があります。作成後にバケットのリージョンを変更することはできません。
[Block Public Access settings for this bucket] (このバケットのパブリックアクセス設定をブロックする)、[Bucket Versioning] (バケットバージョニング)、および [Tags] (タグ) はデフォルト設定のままにしておきます。
[Default encryption] (デフォルトの暗号化) には、[Disable] (無効) を選択します。
[Advanced settings] (詳細設定) はデフォルト設定のままにしておきます。
バケットの設定を確認して、[Create bucket] (バケットの作成) を選択します。

S3 バケットを作成するには、 AWS CLIで [create-bucket] コマンドを使用します。
Linux
```
aws s3api create-bucket \
        --bucket amzn-s3-demo-bucket \
        --region aws-region \
        --create-bucket-configuration LocationConstraint=aws-region
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。

aws-region は、バケットを作成するリージョンです。
macOS
```
aws s3api create-bucket \
        --bucket amzn-s3-demo-bucket \
        --region aws-region \
        --create-bucket-configuration LocationConstraint=aws-region
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。

aws-region は、バケットを作成するリージョンです。
Windows
```
aws s3api create-bucket ^
        --bucket amzn-s3-demo-bucket ^
        --region aws-region ^
        --create-bucket-configuration LocationConstraint=aws-region
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。

aws-region は、バケットを作成するリージョンです。
注記
Amazon Comprehend と Amazon Kendra の両方をサポートするリージョンを選択する必要があります。作成後にバケットのリージョンを変更することはできません。
バケットが正常に作成されたことを確認するには、[list] コマンドを使用します。
Linux
```
aws s3 ls
```
macOS
```
aws s3 ls
```
Windows
```
aws s3 ls
```

S3 バケットにデータフォルダとメタデータフォルダを作成する

S3 バケットを作成した後、その中のフォルダにデータフォルダとメタデータフォルダを作成します。

で Amazon S3 コンソールを開きますhttps://console.aws.amazon.com/s3/。
[Buckets] (バケット) で、バケットのリストからバケットの名前をクリックします。
[Objects] (オブジェクト) タブから、[Create folder] (フォルダの作成) を選択します。
新しいフォルダ名に、data を入力します。
暗号化設定については、[Disable] (無効) を選択します。
[Create folder] (フォルダの作成) を選択します。
ステップ 3 から 6 を繰り返して Amazon Kendra メタデータを保存する別のフォルダーを作成し、ステップ 4 metadata で作成したフォルダに名前を付けます。

S3 バケットで data フォルダを作成するには、 AWS CLIで [put-object] コマンドを使用します。
Linux
```
aws s3api put-object \
        --bucket amzn-s3-demo-bucket \
        --key data/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。
macOS
```
aws s3api put-object \
        --bucket amzn-s3-demo-bucket \
        --key data/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。
Windows
```
aws s3api put-object ^
        --bucket amzn-s3-demo-bucket ^
        --key data/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。
S3 バケットで metadata フォルダを作成するには、 AWS CLIで [put-object] コマンドを使用します。
Linux
```
aws s3api put-object \
        --bucket amzn-s3-demo-bucket \
        --key metadata/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。
macOS
```
aws s3api put-object \
        --bucket amzn-s3-demo-bucket \
        --key metadata/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。
Windows
```
aws s3api put-object ^
        --bucket amzn-s3-demo-bucket ^
        --key metadata/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。
フォルダが正常に作成されたことを確認するには、[list] コマンドを使用してバケットの内容をチェックします。
Linux
```
aws s3 ls s3://amzn-s3-demo-bucket/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。
macOS
```
aws s3 ls s3://amzn-s3-demo-bucket/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。
Windows
```
aws s3 ls s3://amzn-s3-demo-bucket/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket はバケット名です。

入力データをアップロードする

データフォルダとメタデータフォルダを作成したら、サンプルデータセットを data フォルダにアップロードします。

で Amazon S3 コンソールを開きますhttps://console.aws.amazon.com/s3/。
[Buckets] (バケット) で、バケットのリストからバケットの名前、data の順にクリックします。
[Upload] (アップロード)、[Add files] (ファイルの追加) の順に選択します。
ダイアログボックスで、ローカルデバイスの tutorial-dataset フォルダ内の data フォルダで、すべてのファイルを選択し、[Open] (開く) をクリックします。
[Destination] (送信先)、[Permissions] (アクセス許可)、および [Properties] (プロパティ) はデフォルト設定のままにしておきます。
[Upload] (アップロード) を選択します。

サンプルデータを data フォルダにアップロードするには、 AWS CLIで [copy] コマンドを使用します。
Linux
```
aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
```
コードの説明は以下のとおりです。
path/ は、デバイスの tutorial-datasetフォルダへのファイルパスです。

amzn-s3-demo-bucket はバケット名です。
macOS
```
aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
```
コードの説明は以下のとおりです。
path/ は、デバイスの tutorial-datasetフォルダへのファイルパスです。

amzn-s3-demo-bucket はバケット名です。
Windows
```
aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
```
コードの説明は以下のとおりです。
path/ は、デバイスの tutorial-datasetフォルダへのファイルパスです。

amzn-s3-demo-bucket はバケット名です。
データセットファイルが data フォルダに正常にアップロードされたことを確認する場合は、 AWS CLIで [list] コマンドを使用します。
Linux
```
aws s3 ls s3://amzn-s3-demo-bucket/data/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket は S3 バケットの名前です。
macOS
```
aws s3 ls s3://amzn-s3-demo-bucket/data/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket は S3 バケットの名前です。
Windows
```
aws s3 ls s3://amzn-s3-demo-bucket/data/
```
コードの説明は以下のとおりです。
amzn-s3-demo-bucket は S3 バケットの名前です。

このステップを完了すると、data フォルダに S3 バケットのデータセットが保存されされた、metadata フォルダが空になります。このフォルダは Amazon Kendra メタデータを保存します。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

チュートリアル:インテリジェント検索ソリューションの構築

ステップ 2: エンティティを検出する