入力データを準備する - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

入力データを準備する

大部分のクラスターは入力データを読み込んで、そのデータを処理します。データを読み込むには、該当するデータが、クラスターでアクセスできる場所に位置し、かつクラスターで処理できる形式になっている必要があります。最も一般的なシナリオは、入力データを Simple Storage Service (Amazon S3) にアップロードすることです。Amazon EMR には、クラスターが Simple Storage Service (Amazon S3) からデータをインポートまたは読み取るためのツールが用意されています。

Hadoop におけるデフォルトの入力形式はテキストファイルです。ただし、Hadoop をカスタマイズすれば、他の形式で格納されているデータをインポートできます。