Préparation de vos données d’entrée - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Préparation de vos données d’entrée

Si vos données d’entrée ne sont pas compatibles avec les Colonnes de la table qui les recevront, la commande COPY échoue.

Utilisez les instructions suivantes pour vous assurer que vos données d’entrée sont valides :

  • Vos données peuvent contenir uniquement des caractères UTF-8 de quatre octets au plus.

  • Vérifiez que les chaînes CHAR et VARCHAR ne sont pas plus longues que les colonnes correspondantes. Comme les chaînes VARCHAR sont mesurées en octets, pas en caractères, une chaîne de quatre caractères chinois qui occupent quatre octets chacun nécessite une colonne VARCHAR(16), par exemple.

  • Les caractères multioctets ne peuvent être utilisés qu’avec les colonnes VARCHAR. Vérifiez que les caractères multioctets ne dépassent pas quatre octets.

  • Vérifiez que les données des colonnes CHAR ne contiennent que des caractères codés sur un octet.

  • N’incluez pas de caractères spéciaux ou de syntaxe particulière pour indiquer le dernier champ d’un enregistrement. Ce champ peut être un délimiteur.

  • Si vos données incluent des terminaisons null, également appelées NUL (UTF-8 0000) ou zéro binaire (0x000), vous pouvez charger ces caractères en tant que valeurs NULL dans des colonnes CHAR ou VARCHAR en utilisant l’option NULL AS dans la commande COPY : null as '\0' ou null as '\000'. Si vous n’utilisez pas NULL AS, les terminaisons null entraînent l’échec de la commande COPY.

  • Si vos chaînes contiennent des caractères spéciaux, tels que des délimiteurs et des sauts de ligne imbriqués, utilisez l’option ESCAPE avec la commande COPY.

  • Vérifiez que tous les guillemets simples et doubles correspondent de manière appropriée.

  • Vérifiez que les chaînes à virgule flottante sont dans un format à virgule flottante standard, tel que 12,123, ou dans un format d’élévation à la puissance, tel que 1,0E4.

  • Vérifiez que toutes les chaînes de type timestamp et date suivent les spécifications de Chaînes DATEFORMAT et TIMEFORMAT. Le format de type timestamp par défaut est AAAA-MM-JJ hh:mm:ss et le format de date par défaut est AAAA-MM-JJ.

  • Pour plus d’informations sur les limites et limitations des types de données individuels, consultez Types de données. Pour plus d’informations sur les erreurs de caractères multioctets, consultez Erreurs de chargement de caractères multioctets