从 Amazon S3 中加载多字节数据
如果您的数据包含非 ASCII 多字节字符(例如中文或西里尔语字符),则必须将该数据加载到 VARCHAR 列。VARCHAR 数据类型支持四字节的 UTF-8 字符,而 CHAR 数据类型仅接受单字节的 ASCII 字符。您不能将五字节或更长的字符加载到 Amazon Redshift 表中。有关 CHAR 和 VARCHAR 的更多信息,请参阅数据类型。
要检查输入文件使用哪种编码,请使用 Linux file
命令:
$ file ordersdata.txt ordersdata.txt: ASCII English text $ file uni_ordersdata.dat uni_ordersdata.dat: UTF-8 Unicode text