Classements pris en charge par Babelfish - Amazon Aurora

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Classements pris en charge par Babelfish

Lorsque vous créez un cluster de bases de données Aurora PostgreSQL avec Babelfish, vous choisissez un classement pour vos données. Un classement spécifie l'ordre de tri et les modèles de bits qui génèrent le texte ou les caractères dans un langage humain écrit donné. Un classement inclut des règles de comparaison des données pour un ensemble donné de modèles de bits. Le classement est lié à la localisation. Les différents paramètres régionaux affectent le mappage des caractères, l'ordre de tri, etc. Les attributs de classement sont reflétés dans les noms des différents classements. Pour plus d'informations sur les attributs, consultez Babelfish collation attributes table.

Babelfish mappe les classements SQL Server à des classements comparables fournis par Babelfish. Babelfish prédéfinit les classements Unicode avec des comparaisons de chaînes et des ordres de tri sensibles aux particularités culturelles. Babelfish permet également de traduire les classements de votre base de données SQL Server vers le classement Babelfish le plus proche. Des classements spécifiques aux paramètres régionaux sont fournis pour différentes langues et régions.

Certains classements spécifient une page de code correspondant à un encodage côté client. Babelfish traduit automatiquement l'encodage du serveur vers l'encodage du client en fonction du classement de chaque colonne de sortie.

Babelfish prend en charge les classements répertoriés dans Babelfish supported collations table. Babelfish mappe les classements SQL Server à des classements comparables fournis par Babelfish.

Babelfish utilise la version 153.80 de la bibliothèque de classements ICU (International Components for Unicode. Pour plus d'informations sur les classements ICU, consultez Collation (Classement) dans la documentation ICU. Pour en savoir plus sur PostgreSQL et le classement, consultez Collation Support (Prise en charge des classements) dans la documentation PostgreSQL.

Paramètres de cluster de bases de données qui contrôlent le classement et les paramètres régionaux

Les paramètres suivants ont une incidence sur le comportement du classement.

babelfishpg_tsql.default_locale

Ce paramètre spécifie les paramètres régionaux par défaut utilisés par le classement. Ce paramètre est utilisé en combinaison avec les attributs répertoriés dans Babelfish collation attributes table pour personnaliser les classements liés à une langue et à une région spécifiques. La valeur par défaut de ce paramètre est en-US.

Les paramètres régionaux par défaut s'appliquent à tous les noms de classement Babelfish commençant par « BBF » et à tous les classements SQL Server mappés à des classements Babelfish. La modification de la valeur de ce paramètre sur un cluster de bases de données Babelfish existant n'affecte pas les paramètres régionaux des classements existants. Pour obtenir la liste des classements, consultez Babelfish supported collations table.

babelfishpg_tsql.server_collation_name

Ce paramètre spécifie le classement par défaut du serveur (instance de cluster de bases de données Aurora PostgreSQL) et de la base de données. La valeur par défaut est sql_latin1_general_cp1_ci_as. server_collation_name doit être un classement CI_AS car, dans T-SQL, le classement du serveur détermine la façon dont les identifiants sont comparés.

Lorsque vous créez votre cluster de bases de données Babelfish, vous choisissez le Collation name (Nom du classement) dans la liste sélectionnable. Il s'agit notamment des classements répertoriés dans Babelfish supported collations table. Ne modifiez pas server_collation_name après la création de la base de données Babelfish.

Les paramètres que vous choisissez lorsque vous créez votre cluster de bases de données Babelfish for Aurora PostgreSQL sont stockés dans le groupe de paramètres de cluster de bases de données associé au cluster pour ces paramètres et définissent son comportement de classement.

Classements déterministes et non déterministes et Babelfish

Babelfish prend en charge les classements déterministes et non déterministes :

  • Un classement déterministe considère que les caractères dont les séquences d'octets sont identiques sont égaux. Cela signifie que x et X ne sont pas égaux dans un classement déterministe. Les classements déterministes peuvent être sensibles à la casse (CS) et sensibles aux accents (AS).

  • Un classement non déterministe ne nécessite pas de correspondance identique. Un classement non déterministe considère que x et X sont égaux. Les classements non déterministes sont insensibles à la casse (CI) et insensibles aux accents (AI).

Le tableau suivant présente certaines différences de comportement entre Babelfish et PostgreSQL lorsque vous utilisez des classements non déterministes.

Babelfish PostgreSQL

Prend en charge la clause LIKE pour les classements CI_AS.

Ne prend pas en charge la clause LIKE sur les classements non déterministes.

Ne prend pas en charge la clause LIKE sur les classements AI.

Ne prennent pas en charge les opérations de correspondance de modèle sur les classements non déterministes.

Pour obtenir la liste des autres limites et différences de comportement pour Babelfish par rapport à SQL Server et PostgreSQL, consultez Limites et différences de comportement des classements.

Babelfish et SQL Server suivent une convention de dénomination pour les classements qui décrivent les attributs de classement, comme indiqué dans le tableau suivant.

Attribut Description

AI

Insensible aux accents.

AS

Sensibles aux accents.

BIN2

BIN2 exige que les données soient triées dans l'ordre des points de code. L'ordre des points de code Unicode suit le même ordre de caractères pour les encodages UTF-8, UTF-16 et UCS-2. L'ordre des points de code est un classement déterministe rapide.

CI

Insensible à la casse.

CS

Sensible à la casse

PREF

Pour trier les majuscules avant les minuscules, utilisez un classement PREF. Si la comparaison est insensible à la casse, la version majuscule d'une lettre est triée avant la version minuscule, à condition qu'il n'y ait pas d'autre distinction. La bibliothèque ICU prend en charge les préférences pour les majuscules avec colCaseFirst=upper, mais pas pour les classements CI_AS.

PREF ne peut être appliqué qu'aux classements déterministes CS_AS.

Classements pris en charge par Babelfish

Utilisez les classements suivants comme classement de serveur ou classement d'objet.

ID du classement Remarques

bbf_unicode_general_ci_as

Prend en charge la comparaison insensible à la casse et l'opérateur LIKE.

bbf_unicode_cp1_ci_as

Classement non déterministe également connu sous le nom de CP1252.

bbf_unicode_CP1250_ci_as

Classement non déterministe permettant de représenter des textes dans les langues d'Europe centrale et d'Europe de l'Est qui utilisent l'alphabet latin.

bbf_unicode_CP1251_ci_as

Classement non déterministe pour les langues utilisant l'alphabet cyrillique.

bbf_unicode_cp1253_ci_as

Classement non déterministe utilisé pour représenter le grec moderne.

bbf_unicode_cp1254_ci_as

Classement non déterministe qui prend en charge le turc.

bbf_unicode_cp1255_ci_as

Classement non déterministe qui prend en charge l'hébreu.

bbf_unicode_cp1256_ci_as

Classement non déterministe pour les langues utilisant l'alphabet arabe.

bbf_unicode_cp1257_ci_as

Classement non déterministe permettant de prendre en charge les langues estonienne, lettone et lituanienne.

bbf_unicode_cp1258_ci_as

Classement non déterministe utilisé pour les caractères vietnamiens.

bbf_unicode_cp874_ci_as

Classement non déterministe utilisé pour les caractères thaïlandais.

sql_latin1_general_cp1250_ci_as

Encodage non déterministe de caractères sur un octet utilisé pour représenter les caractères latins.

sql_latin1_general_cp1251_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1253_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1254_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1255_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1256_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1257_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1258_ci_as

Classement non déterministe prenant en charge les caractères latins.

chinese_prc_ci_as

Classement non déterministe prenant en charge le chinois (RPC).

cyrillic_general_ci_as

Classement non déterministe prenant en charge l'alphabet cyrillique.

finnish_swedish_ci_as

Classement non déterministe prenant en charge le finnois.

french_ci_as

Classement non déterministe prenant en charge le français.

japanese_ci_as

Classement non déterministe prenant en charge le japonais. Pris en charge dans Babelfish 2.1.0 et versions ultérieures.

korean_wansung_ci_as

Classement non déterministe prenant en charge le coréen (avec tri par dictionnaire).

latin1_general_ci_as

Classement non déterministe prenant en charge les caractères latins.

modern_spanish_ci_as

Classement non déterministe prenant en charge l'espagnol moderne.

polish_ci_as

Classement non déterministe prenant en charge le polonais.

thai_ci_as

Classement non déterministe prenant en charge le thaï.

traditional_spanish_ci_as

Classement non déterministe prenant en charge l'espagnol (tri traditionnel).

turkish_ci_as

Classement non déterministe prenant en charge le turc.

ukrainian_ci_as

Classement non déterministe prenant en charge l'ukrainien.

vietnamese_ci_as

Classement non déterministe prenant en charge le vietnamien.

Vous pouvez utiliser les classements suivants comme classements d'objets.

Langage Options déterministes Options non déterministes

Arabe

Arabic_CS_AS

Arabic_CI_AS, Arabic_CI_AI

Chinois

Chinese_CS_AS

Chinese_CI_AS, Chinese_CI_AI

Cyrillic_General

Cyrillic_General_CS_AS

Cyrillic_General_CI_AS, Cyrillic_General_CI_AI

Estonian

Estonian_CS_AS

Estonian_CI_AS, Estonian_CI_AI

Finnish_Swedish

Finnish_Swedish_CS_AS

Finnish_Swedish_CI_AS, Finnish_Swedish_CI_AI

Français

French_CS_AS

French_CI_AS, French_CI_AI

Grec

Greek_CS_AS

Greek_CI_AS, Greek_CI_AI

Hébreux

Hebrew_CS_AS

Hebrew_CI_AS, Hebrew_CI_AI

Japonais (Babelfish 2.1.0 et versions ultérieures)

Japanese_CS_AS Japanese_CI_AI, Japanese_CI_AS

Korean_Wamsung

Korean_Wamsung_CS_AS

Korean_Wamsung_CI_AS, Korean_Wamsung_CI_AI

Modern_Spanish

Modern_Spanish_CS_AS

Modern_Spanish_CI_AS, Modern_Spanish_CI_AI

Mongol

Mongolian_CS_AS

Mongolian_CI_AS, Mongolian_CI_AI

Polonais

Polish_CS_AS

Polish_CI_AS, Polish_CI_AI

Thaï

Thai_CS_AS

Thai_CI_AS, Thai_CI_AI

Traditional_Spanish

Traditional_Spanish_CS_AS

Traditional_Spanish_CI_AS, Traditional_Spanish_CI_AI

Turc

Turkish_CS_AS

Turkish_CI_AS, Turkish_CI_AI

Ukrainien

Ukrainian_CS_AS

Ukranian_CI_AS, Ukranian_CI_AI

Vietnamien

Vietnamese_CS_AS

Vietnamese_CI_AS, Vietnamese_CI_AI

Classement par défaut dans Babelfish

Auparavant, le classement par défaut des types de données pouvant être classées était pg_catalog.default. Les types de données et les objets qui dépendent de ces types de données sont classés selon le classement sensible à la casse. Cette condition peut avoir un impact sur les objets T-SQL du jeu de données avec un classement sensible à la casse. À partir de Babelfish 2.3.0, le classement par défaut pour les types de données pouvant être classées (à l'exception de TEXT et NTEXT) est le même que le classement du paramètre babelfishpg_tsql.server_collation_name. Lorsque vous passez à Babelfish 2.3.0, le classement par défaut est sélectionné automatiquement au moment de la création du cluster de bases de données, ce qui n'a aucun impact visible.