本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
准备批量加载数据文件
源数据文件具有分隔符分隔的值。更具体的术语通常使用逗号分隔的值 (CSV)。有效的列分隔符包括逗号和竖线。记录用新行分隔。文件必须存储在 Amazon S3 中。创建新的批量加载任务时,源数据的位置由文件指定。ARN文件包含标题。一列代表时间戳。至少还有一列代表一个度量。
用于批量加载的 S3 存储桶必须与用于批量加载的 LiveAnalytics 表的时间流位于同一个区域中。提交批量加载任务后,请勿在批量加载中使用的 S3 存储桶中添加或删除文件。有关使用 S3 存储桶的信息,请参阅 Amazon S3 入门。
注意
CSV由某些应用程序(例如 Excel)生成的文件可能包含与预期编码冲突的字节顺序标记 (BOM)。 LiveAnalytics 批量加载任务的时间流,这些任务引用了在以编程方式处理时会引BOM发错误的CSV文件。为避免这种情况,您可以移除BOM,这是一个不可见的字符。
例如,您可以从允许您指定新编码的应用程序(例如 Notepad++)中保存文件。您也可以使用编程选项来读取第一行,从该行中删除字符,然后将新值写入文件中的第一行。
从 Excel 保存时,有多个CSV选项。使用其他CSV选项保存可能会防止出现上述问题。但是你应该检查结果,因为编码的变化可能会影响某些字符。
CSV格式参数
当你表示一个原本由格式参数保留的值时,你可以使用转义字符。例如,如果引号字符是双引号,则要在数据中表示双引号,请将转义字符放在双引号之前。
有关在创建批量加载任务时何时指定这些内容的信息,请参阅创建批量加载任务。
参数 | Options |
---|---|
列分隔符 | (逗号 (',') | 竖线 ('|') | 分号 (';') | Tab ('/t') | 空格 ('')) |
转义字符 | none |
引用字符 | 控制台:(双引号 (“) | 单引号 (')) |
空值 | 空格 ('') |
修剪空白 | 主机:(否 | 是) |