Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Einstellungen der Zeichenersetzungsaufgabe
Sie können angeben, dass Ihre Replikationsaufgabe Zeichenersetzungen in der Zieldatenbank für alle Quelldatenbankspalten mit dem Datentyp AWS DMS
STRING
oder WSTRING
durchführt. Informationen zur Verwendung einer Aufgabenkonfigurationsdatei zum Festlegen von Aufgabeneinstellungen finden Sie unter Beispiel für Aufgabeneinstellungen.
Sie können die Zeichenersetzung für jede Aufgabe mit Endpunkten aus den folgenden Quell- und Zieldatenbanken konfigurieren:
-
Quelldatenbanken:
-
Oracle
-
Microsoft SQL Server
-
MySQL
-
PostgreSQL
-
SAP Adaptive Server Enterprise (ASE)
-
IBM Db2 (LUW)
-
-
Zieldatenbanken:
-
Oracle
-
Microsoft SQL Server
-
MySQL
-
PostgreSQL
-
SAP Adaptive Server Enterprise (ASE)
-
Amazon Redshift
-
Sie können Zeichenersetzungen mithilfe des Parameters CharacterSetSettings
in Ihren Aufgabeneinstellungen angeben. Diese Zeichenersetzungen erfolgen für Zeichen, die mit dem Unicode-Codepunktwert in Hexadezimalnotation angegeben werden. Sie können die Ersetzungen in zwei Phasen in der folgenden Reihenfolge implementieren, wenn beide angegeben sind:
-
Individuelle Zeichenersetzung — AWS DMS kann die Werte ausgewählter Zeichen in der Quelle durch die angegebenen Ersatzwerte der entsprechenden Zeichen auf dem Ziel ersetzen. Verwenden Sie das
CharacterReplacements
-Array inCharacterSetSettings
, um alle Quellzeichen mit den von Ihnen angegebenen Unicode-Codepunkten auszuwählen. Verwenden Sie dieses Array auch, um die Ersatz-Codepunkte für die entsprechenden Zeichen auf dem Ziel anzugeben.Um alle Zeichen in der Quelle auszuwählen, die einen bestimmten Codepunkt haben, legen Sie eine Instance von
SourceCharacterCodePoint
imCharacterReplacements
-Array auf diesen Codepunkt fest. Geben Sie dann den Ersatz-Codepunkt für alle gleichwertigen Zielzeichen an, indem Sie die entsprechende Instance vonTargetCharacterCodePoint
in diesem Array festlegen. Um Zielzeichen zu löschen, anstatt sie zu ersetzen, setzen Sie die entsprechenden Instances vonTargetCharacterCodePoint
auf Null (0). Sie können beliebig viele verschiedene Werte von Zielzeichen ersetzen oder löschen, indem Sie zusätzliche Paare vonSourceCharacterCodePoint
- undTargetCharacterCodePoint
-Einstellungen imCharacterReplacements
-Array angeben. Wenn Sie denselben Wert für mehrere Instances vonSourceCharacterCodePoint
angeben, gilt der Wert der letzten entsprechenden Einstellung vonTargetCharacterCodePoint
für das Ziel.Angenommen, Sie geben z. B. die folgenden Werte für
CharacterReplacements
an."CharacterSetSettings": { "CharacterReplacements": [ { "SourceCharacterCodePoint": 62, "TargetCharacterCodePoint": 61 }, { "SourceCharacterCodePoint": 42, "TargetCharacterCodePoint": 41 } ] }
In diesem Beispiel werden alle Zeichen mit dem Quellcodepunkt-Hexadezimalwert 62 auf dem Ziel durch Zeichen mit dem Codepunktwert 61 AWS DMS ersetzt. AWS DMS Ersetzt außerdem alle Zeichen mit dem Quellcodepunkt 42 auf dem Ziel durch Zeichen mit dem Codepunktwert 41. Anders gesagt, ersetzt AWS DMS alle Instances des Buchstaben
'b'
auf dem Ziel durch den Buchstaben'a'
. AWS DMS Ersetzt auf ähnliche Weise alle Vorkommen des Buchstabens'B'
auf dem Ziel durch den Buchstaben'A'
. -
Überprüfung und Ersetzung des Zeichensatzes — Nachdem alle einzelnen Zeichen ersetzt wurden, AWS DMS kann sichergestellt werden, dass alle Zielzeichen gültige Unicode-Codepunkte in dem von Ihnen angegebenen Zeichensatz enthalten. Sie verwenden
CharacterSetSupport
inCharacterSetSettings
, um diese Verifizierung und Modifizierung von Zielzeichen zu konfigurieren. Um den Verifizierungszeichensatz anzugeben, legen SieCharacterSet
inCharacterSetSupport
auf den Zeichenfolgenwert des Zeichensatzes fest. (Nachstehend finden Sie die möglichen Werte fürCharacterSet
.) Sie können die ungültigen Zielzeichen auf eine der folgenden Arten AWS DMS ändern:-
Geben Sie einen einzigen Ersatz-Unicode-Codepunkt für alle ungültigen Zielzeichen an, unabhängig von ihrem aktuellen Codepunkt. Um diesen Ersatz-Codepunkt zu konfigurieren, setzen Sie
ReplaceWithCharacterCodePoint
inCharacterSetSupport
auf den angegebenen Wert. -
Konfigurieren Sie das Löschen aller ungültigen Zielzeichen, indem Sie
ReplaceWithCharacterCodePoint
auf Null (0) setzen.
Angenommen, Sie geben z. B. die folgenden Werte für
CharacterSetSupport
an."CharacterSetSettings": { "CharacterSetSupport": { "CharacterSet": "UTF16_PlatformEndian", "ReplaceWithCharacterCodePoint": 0 } }
In diesem Beispiel AWS DMS werden alle Zeichen auf dem Ziel gelöscht, die im
"UTF16_PlatformEndian"
Zeichensatz ungültig sind. Daher werden alle mit dem Hexadezimalwert2FB6
angegebenen Zeichen gelöscht. Dieser Wert ist ungültig, da es sich um einen 4-Byte-Unicode-Codepunkt handelt und UTF16 Zeichensätze nur Zeichen mit 2-Byte-Codepunkten akzeptieren. -
Anmerkung
Die Replikationsaufgabe schließt alle angegebenen Zeichenersetzungen ab, bevor globale Transformationen oder Transformationen auf Tabellenebene gestartet werden, die Sie über die Tabellenzuordnung angeben. Weitere Informationen zur Tabellenzuweisung finden Sie unter Verwenden der Tabellenzuweisung zum Angeben von Aufgabeneinstellungen.
Die Zeichenersetzung unterstützt keine LOB-Datentypen. Dazu gehören alle Datentypen, die DMS als LOB-Datentyp betrachtet. Beispielsweise wird der Datentyp Extended
in Oracle als LOB betrachtet. Weitere Hinweise zu Quelldatentypen finden Sie unter Quelldatentypen für Oracle.
Die Werte, die für AWS DMS CharacterSet
unterstützen, sind in der folgenden Tabelle aufgeführt.
UTF-8 |
ibm-860_P100-1995 |
ibm-280_P100-1995 |
UTF-16 |
ibm-861_P100-1995 |
ibm-284_P100-1995 |
UTF-16BE |
ibm-862_P100-1995 |
ibm-285_P100-1995 |
UTF-16LE |
ibm-863_P100-1995 |
ibm-290_P100-1995 |
UTF-32 |
ibm-864_X110-1999 |
ibm-297_P100-1995 |
UTF-32BE |
ibm-865_P100-1995 |
ibm-420_X120-1999 |
UTF-32LE |
ibm-866_P100-1995 |
ibm-424_P100-1995 |
UTF16_PlatformEndian |
ibm-867_P100-1998 |
ibm-500_P100-1995 |
UTF16_OppositeEndian |
ibm-868_P100-1995 |
ibm-803_P100-1999 |
UTF32_PlatformEndian |
ibm-869_P100-1995 |
ibm-838_P100-1995 |
UTF32_OppositeEndian |
ibm-878_P100-1996 |
ibm-870_P100-1995 |
UTF-16BE,version=1 |
ibm-901_P100-1999 |
ibm-871_P100-1995 |
UTF-16LE,version=1 |
ibm-902_P100-1999 |
ibm-875_P100-1995 |
UTF-16,version=1 |
ibm-922_P100-1999 |
ibm-918_P100-1995 |
UTF-16,version=2 |
ibm-1168_P100-2002 |
ibm-930_P120-1999 |
UTF-7 |
ibm-4909_P100-1999 |
ibm-933_P110-1995 |
IMAP-mailbox-name |
ibm-5346_P100-1998 |
ibm-935_P110-1999 |
SCSU |
ibm-5347_P100-1998 |
ibm-937_P110-1999 |
BOCU-1 |
ibm-5348_P100-1997 |
ibm-939_P120-1999 |
CESU-8 |
ibm-5349_P100-1998 |
ibm-1025_P100-1995 |
ISO-8859-1 |
ibm-5350_P100-1998 |
ibm-1026_P100-1995 |
US-ASCII |
ibm-9447_P100-2002 |
ibm-1047_P100-1995 |
gb18030 |
ibm-9448_X100-2005 |
ibm-1097_P100-1995 |
ibm-912_P100-1995 |
ibm-9449_P100-2002 |
ibm-1112_P100-1995 |
ibm-913_P100-2000 |
ibm-5354_P100-1998 |
ibm-1122_P100-1999 |
ibm-914_P100-1995 |
ibm-1250_P100-1995 |
ibm-1123_P100-1995 |
ibm-915_P100-1995 |
ibm-1251_P100-1995 |
ibm-1130_P100-1997 |
ibm-1089_P100-1995 |
ibm-1252_P100-2000 |
ibm-1132_P100-1998 |
ibm-9005_X110-2007 |
ibm-1253_P100-1995 |
ibm-1137_P100-1999 |
ibm-813_P100-1995 |
ibm-1254_P100-1995 |
ibm-4517_P100-2005 |
ibm-5012_P100-1999 |
ibm-1255_P100-1995 |
ibm-1140_P100-1997 |
ibm-916_P100-1995 |
ibm-5351_P100-1998 |
ibm-1141_P100-1997 |
ibm-920_P100-1995 |
ibm-1256_P110-1997 |
ibm-1142_P100-1997 |
iso-8859_10-1998 |
ibm-5352_P100-1998 |
ibm-1143_P100-1997 |
iso-8859_11-2001 |
ibm-1257_P100-1995 |
ibm-1144_P100-1997 |
ibm-921_P100-1995 |
ibm-5353_P100-1998 |
ibm-1145_P100-1997 |
iso-8859_14-1998 |
ibm-1258_P100-1997 |
ibm-1146_P100-1997 |
ibm-923_P100-1998 |
macos-0_2-10.2 |
ibm-1147_P100-1997 |
ibm-942_P12A-1999 |
macos-6_2-10.4 |
ibm-1148_P100-1997 |
ibm-943_P15A-2003 |
macos-7_3-10.2 |
ibm-1149_P100-1997 |
ibm-943_P130-1999 |
macos-29-10.2 |
ibm-1153_P100-1999 |
ibm-33722_P12A_P12A-2009_U2 |
macos-35-10.2 |
ibm-1154_P100-1999 |
ibm-33722_P120-1999 |
ibm-1051_P100-1995 |
ibm-1155_P100-1999 |
ibm-954_P101-2007 |
ibm-1276_P100-1995 |
ibm-1156_P100-1999 |
euc-jp-2007 |
ibm-1006_P100-1995 |
ibm-1157_P100-1999 |
ibm-1373_P100-2002 |
ibm-1098_P100-1995 |
ibm-1158_P100-1999 |
windows-950-2000 |
ibm-1124_P100-1996 |
ibm-1160_P100-1999 |
ibm-950_P110-1999 |
ibm-1125_P100-1997 |
ibm-1164_P100-1999 |
ibm-1375_P100-2008 |
ibm-1129_P100-1997 |
ibm-1364_P110-2007 |
ibm-5471_P100-2006 |
ibm-1131_P100-1997 |
ibm-1371_P100-1999 |
ibm-1386_P100-2001 |
ibm-1133_P100-1997 |
ibm-1388_P103-2001 |
windows-936-2000 |
ISO_2022,locale=ja,version=0 |
ibm-1390_P110-2003 |
ibm-1383_P110-1999 |
ISO_2022,locale=ja,version=1 |
ibm-1399_P110-2003 |
ibm-5478_P100-1995 |
ISO_2022,locale=ja,version=2 |
ibm-5123_P100-1999 |
euc-tw-2014 |
ISO_2022,locale=ja,version=3 |
ibm-8482_P100-1999 |
ibm-964_P110-1999 |
ISO_2022,locale=ja,version=4 |
ibm-16684_P110-2003 |
ibm-949_P110-1999 |
ISO_2022,locale=ko,version=0 |
ibm-4899_P100-1998 |
ibm-949_P11A-1999 |
ISO_2022,locale=ko,version=1 |
ibm-4971_P100-1999 |
ibm-970_P110_P110-2006_U2 |
ISO_2022,locale=zh,version=0 |
ibm-9067_X100-2005 |
ibm-971_P100-1995 |
ISO_2022,locale=zh,version=1 |
ibm-12712_P100-1998 |
ibm-1363_P11B-1998 |
ISO_2022,locale=zh,version=2 |
ibm-16804_X110-1999 |
ibm-1363_P110-1997 |
HZ |
ibm-37_P100-1995,swaplfnl |
windows-949-2000 |
x11-compound-text |
ibm-1047_P100-1995,swaplfnl |
windows-874-2000 |
ISCII,version=0 |
ibm-1140_P100-1997,swaplfnl |
ibm-874_P100-1995 |
ISCII,version=1 |
ibm-1141_P100-1997,swaplfnl |
ibm-1162_P100-1999 |
ISCII,version=2 |
ibm-1142_P100-1997,swaplfnl |
ibm-437_P100-1995 |
ISCII,version=3 |
ibm-1143_P100-1997,swaplfnl |
ibm-720_P100-1997 |
ISCII,version=4 |
ibm-1144_P100-1997,swaplfnl |
ibm-737_P100-1997 |
ISCII,version=5 |
ibm-1145_P100-1997,swaplfnl |
ibm-775_P100-1996 |
ISCII,version=6 |
ibm-1146_P100-1997,swaplfnl |
ibm-850_P100-1995 |
ISCII,version=7 |
ibm-1147_P100-1997,swaplfnl |
ibm-851_P100-1995 |
ISCII,version=8 |
ibm-1148_P100-1997,swaplfnl |
ibm-852_P100-1995 |
LMBCS-1 |
ibm-1149_P100-1997,swaplfnl |
ibm-855_P100-1995 |
ibm-37_P100-1995 |
ibm-1153_P100-1999,swaplfnl |
ibm-856_P100-1995 |
ibm-273_P100-1995 |
ibm-12712_P100-1998,swaplfnl |
ibm-857_P100-1995 |
ibm-277_P100-1995 |
ibm-16804_X110-1999,swaplfnl |
ibm-858_P100-1997 |
ibm-278_P100-1995 |
ebcdic-xml-us |