Einstellungen der Zeichenersetzungsaufgabe - AWS Database Migration Service

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einstellungen der Zeichenersetzungsaufgabe

Sie können angeben, dass Ihre Replikationsaufgabe Zeichenersetzungen in der Zieldatenbank für alle Quelldatenbankspalten mit dem Datentyp AWS DMS STRING oder WSTRING durchführt. Informationen zur Verwendung einer Aufgabenkonfigurationsdatei zum Festlegen von Aufgabeneinstellungen finden Sie unter Beispiel für Aufgabeneinstellungen.

Sie können die Zeichenersetzung für jede Aufgabe mit Endpunkten aus den folgenden Quell- und Zieldatenbanken konfigurieren:

  • Quelldatenbanken:

    • Oracle

    • Microsoft SQL Server

    • MySQL

    • PostgreSQL

    • SAP Adaptive Server Enterprise (ASE)

    • IBM Db2 (LUW)

  • Zieldatenbanken:

    • Oracle

    • Microsoft SQL Server

    • MySQL

    • PostgreSQL

    • SAP Adaptive Server Enterprise (ASE)

    • Amazon Redshift

Sie können Zeichenersetzungen mithilfe des Parameters CharacterSetSettings in Ihren Aufgabeneinstellungen angeben. Diese Zeichenersetzungen erfolgen für Zeichen, die mit dem Unicode-Codepunktwert in Hexadezimalnotation angegeben werden. Sie können die Ersetzungen in zwei Phasen in der folgenden Reihenfolge implementieren, wenn beide angegeben sind:

  1. Individuelle Zeichenersetzung — AWS DMS kann die Werte ausgewählter Zeichen in der Quelle durch die angegebenen Ersatzwerte der entsprechenden Zeichen auf dem Ziel ersetzen. Verwenden Sie das CharacterReplacements-Array in CharacterSetSettings, um alle Quellzeichen mit den von Ihnen angegebenen Unicode-Codepunkten auszuwählen. Verwenden Sie dieses Array auch, um die Ersatz-Codepunkte für die entsprechenden Zeichen auf dem Ziel anzugeben.

    Um alle Zeichen in der Quelle auszuwählen, die einen bestimmten Codepunkt haben, legen Sie eine Instance von SourceCharacterCodePoint im CharacterReplacements-Array auf diesen Codepunkt fest. Geben Sie dann den Ersatz-Codepunkt für alle gleichwertigen Zielzeichen an, indem Sie die entsprechende Instance von TargetCharacterCodePoint in diesem Array festlegen. Um Zielzeichen zu löschen, anstatt sie zu ersetzen, setzen Sie die entsprechenden Instances von TargetCharacterCodePoint auf Null (0). Sie können beliebig viele verschiedene Werte von Zielzeichen ersetzen oder löschen, indem Sie zusätzliche Paare von SourceCharacterCodePoint- und TargetCharacterCodePoint-Einstellungen im CharacterReplacements-Array angeben. Wenn Sie denselben Wert für mehrere Instances von SourceCharacterCodePoint angeben, gilt der Wert der letzten entsprechenden Einstellung von TargetCharacterCodePoint für das Ziel.

    Angenommen, Sie geben z. B. die folgenden Werte für CharacterReplacements an.

    "CharacterSetSettings": { "CharacterReplacements": [ { "SourceCharacterCodePoint": 62, "TargetCharacterCodePoint": 61 }, { "SourceCharacterCodePoint": 42, "TargetCharacterCodePoint": 41 } ] }

    In diesem Beispiel werden alle Zeichen mit dem Quellcodepunkt-Hexadezimalwert 62 auf dem Ziel durch Zeichen mit dem Codepunktwert 61 AWS DMS ersetzt. AWS DMS Ersetzt außerdem alle Zeichen mit dem Quellcodepunkt 42 auf dem Ziel durch Zeichen mit dem Codepunktwert 41. Anders gesagt, ersetzt AWS DMS alle Instances des Buchstaben 'b'auf dem Ziel durch den Buchstaben 'a'. AWS DMS Ersetzt auf ähnliche Weise alle Vorkommen des Buchstabens 'B' auf dem Ziel durch den Buchstaben'A'.

  2. Überprüfung und Ersetzung des Zeichensatzes — Nachdem alle einzelnen Zeichen ersetzt wurden, AWS DMS kann sichergestellt werden, dass alle Zielzeichen gültige Unicode-Codepunkte in dem von Ihnen angegebenen Zeichensatz enthalten. Sie verwenden CharacterSetSupport in CharacterSetSettings, um diese Verifizierung und Modifizierung von Zielzeichen zu konfigurieren. Um den Verifizierungszeichensatz anzugeben, legen Sie CharacterSet in CharacterSetSupport auf den Zeichenfolgenwert des Zeichensatzes fest. (Nachstehend finden Sie die möglichen Werte für CharacterSet.) Sie können die ungültigen Zielzeichen auf eine der folgenden Arten AWS DMS ändern:

    • Geben Sie einen einzigen Ersatz-Unicode-Codepunkt für alle ungültigen Zielzeichen an, unabhängig von ihrem aktuellen Codepunkt. Um diesen Ersatz-Codepunkt zu konfigurieren, setzen Sie ReplaceWithCharacterCodePoint in CharacterSetSupport auf den angegebenen Wert.

    • Konfigurieren Sie das Löschen aller ungültigen Zielzeichen, indem Sie ReplaceWithCharacterCodePoint auf Null (0) setzen.

    Angenommen, Sie geben z. B. die folgenden Werte für CharacterSetSupport an.

    "CharacterSetSettings": { "CharacterSetSupport": { "CharacterSet": "UTF16_PlatformEndian", "ReplaceWithCharacterCodePoint": 0 } }

    In diesem Beispiel AWS DMS werden alle Zeichen auf dem Ziel gelöscht, die im "UTF16_PlatformEndian" Zeichensatz ungültig sind. Daher werden alle mit dem Hexadezimalwert 2FB6 angegebenen Zeichen gelöscht. Dieser Wert ist ungültig, da es sich um einen 4-Byte-Unicode-Codepunkt handelt und UTF16 Zeichensätze nur Zeichen mit 2-Byte-Codepunkten akzeptieren.

Anmerkung

Die Replikationsaufgabe schließt alle angegebenen Zeichenersetzungen ab, bevor globale Transformationen oder Transformationen auf Tabellenebene gestartet werden, die Sie über die Tabellenzuordnung angeben. Weitere Informationen zur Tabellenzuweisung finden Sie unter Verwenden der Tabellenzuweisung zum Angeben von Aufgabeneinstellungen.

Die Zeichenersetzung unterstützt keine LOB-Datentypen. Dazu gehören alle Datentypen, die DMS als LOB-Datentyp betrachtet. Beispielsweise wird der Datentyp Extended in Oracle als LOB betrachtet. Weitere Hinweise zu Quelldatentypen finden Sie unter Quelldatentypen für Oracle.

Die Werte, die für AWS DMS CharacterSet unterstützen, sind in der folgenden Tabelle aufgeführt.

UTF-8 ibm-860_P100-1995 ibm-280_P100-1995
UTF-16 ibm-861_P100-1995 ibm-284_P100-1995
UTF-16BE ibm-862_P100-1995 ibm-285_P100-1995
UTF-16LE ibm-863_P100-1995 ibm-290_P100-1995
UTF-32 ibm-864_X110-1999 ibm-297_P100-1995
UTF-32BE ibm-865_P100-1995 ibm-420_X120-1999
UTF-32LE ibm-866_P100-1995 ibm-424_P100-1995
UTF16_PlatformEndian ibm-867_P100-1998 ibm-500_P100-1995
UTF16_OppositeEndian ibm-868_P100-1995 ibm-803_P100-1999
UTF32_PlatformEndian ibm-869_P100-1995 ibm-838_P100-1995
UTF32_OppositeEndian ibm-878_P100-1996 ibm-870_P100-1995
UTF-16BE,version=1 ibm-901_P100-1999 ibm-871_P100-1995
UTF-16LE,version=1 ibm-902_P100-1999 ibm-875_P100-1995
UTF-16,version=1 ibm-922_P100-1999 ibm-918_P100-1995
UTF-16,version=2 ibm-1168_P100-2002 ibm-930_P120-1999
UTF-7 ibm-4909_P100-1999 ibm-933_P110-1995
IMAP-mailbox-name ibm-5346_P100-1998 ibm-935_P110-1999
SCSU ibm-5347_P100-1998 ibm-937_P110-1999
BOCU-1 ibm-5348_P100-1997 ibm-939_P120-1999
CESU-8 ibm-5349_P100-1998 ibm-1025_P100-1995
ISO-8859-1 ibm-5350_P100-1998 ibm-1026_P100-1995
US-ASCII ibm-9447_P100-2002 ibm-1047_P100-1995
gb18030 ibm-9448_X100-2005 ibm-1097_P100-1995
ibm-912_P100-1995 ibm-9449_P100-2002 ibm-1112_P100-1995
ibm-913_P100-2000 ibm-5354_P100-1998 ibm-1122_P100-1999
ibm-914_P100-1995 ibm-1250_P100-1995 ibm-1123_P100-1995
ibm-915_P100-1995 ibm-1251_P100-1995 ibm-1130_P100-1997
ibm-1089_P100-1995 ibm-1252_P100-2000 ibm-1132_P100-1998
ibm-9005_X110-2007 ibm-1253_P100-1995 ibm-1137_P100-1999
ibm-813_P100-1995 ibm-1254_P100-1995 ibm-4517_P100-2005
ibm-5012_P100-1999 ibm-1255_P100-1995 ibm-1140_P100-1997
ibm-916_P100-1995 ibm-5351_P100-1998 ibm-1141_P100-1997
ibm-920_P100-1995 ibm-1256_P110-1997 ibm-1142_P100-1997
iso-8859_10-1998 ibm-5352_P100-1998 ibm-1143_P100-1997
iso-8859_11-2001 ibm-1257_P100-1995 ibm-1144_P100-1997
ibm-921_P100-1995 ibm-5353_P100-1998 ibm-1145_P100-1997
iso-8859_14-1998 ibm-1258_P100-1997 ibm-1146_P100-1997
ibm-923_P100-1998 macos-0_2-10.2 ibm-1147_P100-1997
ibm-942_P12A-1999 macos-6_2-10.4 ibm-1148_P100-1997
ibm-943_P15A-2003 macos-7_3-10.2 ibm-1149_P100-1997
ibm-943_P130-1999 macos-29-10.2 ibm-1153_P100-1999
ibm-33722_P12A_P12A-2009_U2 macos-35-10.2 ibm-1154_P100-1999
ibm-33722_P120-1999 ibm-1051_P100-1995 ibm-1155_P100-1999
ibm-954_P101-2007 ibm-1276_P100-1995 ibm-1156_P100-1999
euc-jp-2007 ibm-1006_P100-1995 ibm-1157_P100-1999
ibm-1373_P100-2002 ibm-1098_P100-1995 ibm-1158_P100-1999
windows-950-2000 ibm-1124_P100-1996 ibm-1160_P100-1999
ibm-950_P110-1999 ibm-1125_P100-1997 ibm-1164_P100-1999
ibm-1375_P100-2008 ibm-1129_P100-1997 ibm-1364_P110-2007
ibm-5471_P100-2006 ibm-1131_P100-1997 ibm-1371_P100-1999
ibm-1386_P100-2001 ibm-1133_P100-1997 ibm-1388_P103-2001
windows-936-2000 ISO_2022,locale=ja,version=0 ibm-1390_P110-2003
ibm-1383_P110-1999 ISO_2022,locale=ja,version=1 ibm-1399_P110-2003
ibm-5478_P100-1995 ISO_2022,locale=ja,version=2 ibm-5123_P100-1999
euc-tw-2014 ISO_2022,locale=ja,version=3 ibm-8482_P100-1999
ibm-964_P110-1999 ISO_2022,locale=ja,version=4 ibm-16684_P110-2003
ibm-949_P110-1999 ISO_2022,locale=ko,version=0 ibm-4899_P100-1998
ibm-949_P11A-1999 ISO_2022,locale=ko,version=1 ibm-4971_P100-1999
ibm-970_P110_P110-2006_U2 ISO_2022,locale=zh,version=0 ibm-9067_X100-2005
ibm-971_P100-1995 ISO_2022,locale=zh,version=1 ibm-12712_P100-1998
ibm-1363_P11B-1998 ISO_2022,locale=zh,version=2 ibm-16804_X110-1999
ibm-1363_P110-1997 HZ ibm-37_P100-1995,swaplfnl
windows-949-2000 x11-compound-text ibm-1047_P100-1995,swaplfnl
windows-874-2000 ISCII,version=0 ibm-1140_P100-1997,swaplfnl
ibm-874_P100-1995 ISCII,version=1 ibm-1141_P100-1997,swaplfnl
ibm-1162_P100-1999 ISCII,version=2 ibm-1142_P100-1997,swaplfnl
ibm-437_P100-1995 ISCII,version=3 ibm-1143_P100-1997,swaplfnl
ibm-720_P100-1997 ISCII,version=4 ibm-1144_P100-1997,swaplfnl
ibm-737_P100-1997 ISCII,version=5 ibm-1145_P100-1997,swaplfnl
ibm-775_P100-1996 ISCII,version=6 ibm-1146_P100-1997,swaplfnl
ibm-850_P100-1995 ISCII,version=7 ibm-1147_P100-1997,swaplfnl
ibm-851_P100-1995 ISCII,version=8 ibm-1148_P100-1997,swaplfnl
ibm-852_P100-1995 LMBCS-1 ibm-1149_P100-1997,swaplfnl
ibm-855_P100-1995 ibm-37_P100-1995 ibm-1153_P100-1999,swaplfnl
ibm-856_P100-1995 ibm-273_P100-1995 ibm-12712_P100-1998,swaplfnl
ibm-857_P100-1995 ibm-277_P100-1995 ibm-16804_X110-1999,swaplfnl
ibm-858_P100-1997 ibm-278_P100-1995 ebcdic-xml-us