Chargement d’un shapefile dans Amazon Redshift - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Chargement d’un shapefile dans Amazon Redshift

Vous pouvez utiliser la commande COPY pour ingérer des shapefiles Esri stockés dans Amazon S3 dans des tables Amazon Redshift. Un shapefile stocke l’emplacement géométrique et les informations d’attribut des fonctions géographiques dans un format vectoriel. Le format du shapefile peut décrire les aspects spatiaux des objets spatiaux tels que les points, les lignes et les polygones. Pour plus d’informations sur les shapefiles, consultez Shapefile dans Wikipédia.

La commande COPY prend en charge le paramètre de format de données SHAPEFILE. Par défaut, la première colonne du shapefile est une colonne GEOMETRY ou IDENTITY. Toutes les colonnes suivantes suivent l’ordre spécifié dans le shapefile. Cependant, la table cible n’a pas besoin d’être dans cette disposition exacte, car vous pouvez utiliser le mappage de colonne COPY pour définir l’ordre. Pour plus d’informations sur la prise en charge du shapefile de commande COPY, consultez SHAPEFILE.

Dans certains cas, la taille de géométrie résultante peut être supérieure au maximum pour stocker une géométrie dans Amazon Redshift. Si c’est le cas, vous pouvez utiliser l’option COPY SIMPLIFY ou SIMPLIFY AUTO pour simplifier les géométries pendant l’ingestion comme suit :

  • Spécifiez SIMPLIFY tolerance pour simplifier toutes les géométries pendant l’ingestion à l’aide de l’algorithme Ramer-Douglas-Peucker et de la tolérance donnée.

  • Spécifiez SIMPLIFY AUTO sans tolérance pour simplifier uniquement les géométries supérieures à la taille maximale à l’aide de l’algorithme Ramer-Douglas-Peucker. Cette approche calcule la tolérance minimale suffisamment grande pour stocker l’objet dans la limite de taille maximale.

  • Spécifiez SIMPLIFY AUTO max_tolerance pour simplifier uniquement les géométries supérieures à la taille maximale à l’aide de l’algorithme Ramer-Douglas-Peucker et de la tolérance calculée automatiquement. Cette approche permet de s’assurer que la tolérance ne dépasse pas la tolérance maximale.

Pour plus d’informations sur la taille maximale d’une valeur de données GEOMETRY, consultez Éléments à prendre en compte lors de l’utilisation de données spatiales dans Amazon Redshift.

Dans certains cas, la tolérance est suffisamment faible pour que l’enregistrement ne puisse pas passer en dessous de la taille maximale d’une valeur de données GEOMETRY. Dans ces cas, vous pouvez utiliser l’option MAXERROR de la commande COPY pour ignorer la totalité ou jusqu’à un certain nombre d’erreurs d’ingestion.

La commande COPY prend également en charge le chargement des shapefiles GZIP. Pour ce faire, spécifiez le paramètre COPY GZIP. Avec cette option, tous les composants du shapefile doivent être compressés indépendamment et partager le même suffixe de compression.

Si un fichier de description de projection (.prj) existe avec le fichier de formes, Redshift l’utilise pour déterminer l’ID du système de référence spatiale (SRID). Si le SRID est valide, ce SRID est attribué à la géométrie résultante. Si la valeur SRID associée à la géométrie d’entrée n’existe pas, la géométrie résultante a la valeur SRID zéro. Vous pouvez désactiver la détection automatique de l’ID du système de référence spatiale au niveau de la séance à l’aide de SET read_srid_on_shapefile_ingestion pour OFF.

Interrogez les vues système SYS_SPATIAL_SIMPLIFY ou SVL_SPATIAL_SIMPLIFY pour afficher les enregistrements qui ont été simplifiés ainsi que la tolérance calculée. Lorsque vous spécifiez SIMPLIFY tolerance, cette vue contient un enregistrement pour chaque opération COPY. Sinon, il contient un enregistrement pour chaque géométrie simplifiée. Pour plus d’informations, consultez SYS_SPATIAL_SIMPLIFY ou SVL_SPATIAL_SIMPLIFICATION.

Pour obtenir des exemples de chargement d’un shapefile, consultez Chargement d’un shapefile dans Amazon Redshift.