印刷不可の UTF-8 文字データを読み取る
Hive テーブル作成時に STORED
AS SEQUENCEFILE
句を使用すると、印刷不可の UTF-8 文字データを読み取り、書き込むことができます。SequenceFile は Hadoop バイナリファイル形式です。このファイルを読み取るには
Hadoop を使用する必要があります。次の例は、DynamoDB のデータを Amazon S3 にエクスポートする方法を示しています。この機能を使用して印刷不可の
UTF-8 でエンコードされた文字を処理できます。
CREATE EXTERNAL TABLE
s3_export
(a_col string, b_col bigint, c_col array<string>
) STORED AS SEQUENCEFILE LOCATION 's3://bucketname/path/subpath/
'; INSERT OVERWRITE TABLEs3_export
SELECT * FROMhiveTableName
;