SSIS konvertieren inAWS GluemitAWS SCT - AWS Schema Conversion Tool

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SSIS konvertieren inAWS GluemitAWS SCT

Im Folgenden erfahren Sie, wie Sie Microsoft SQL Server Integration Services (SSIS) -Pakete konvertieren inAWS Glueunter Verwendung vonAWS SCT.

Um Microsoft SSIS-Pakete zu konvertierenAWS Glue, stellen Sie sicher, dass SieAWS SCTVersion 1.0.642 oder höher. Sie benötigen auch ein SSIS-Projekt mit ETL-Paketen —.dtsx,.conmgr, und.paramsDateien im lokalen Ordner.

Sie benötigen keinen installierten SSIS-Server. Der Konvertierungsprozess erfolgt über die lokalen SSIS-Dateien.

Um ein SSIS-Paket zu konvertierenAWS Glueunter Verwendung vonAWS SCT
  1. Erstellen Sie ein neues Projekt inAWS SCToder öffnen Sie ein bestehendes Projekt. Weitere Informationen finden Sie unter EinAWS SCT Projekt erstellen.

  2. Wählen SieQuelle hinzufügenaus dem Menü, um Ihrem Projekt ein neues SSIS-Quellpaket hinzuzufügen.

  3. Wählen SieSQL Server-Integrationsdiensteund vervollständigen Sie das Folgende:

    • Name der Verbindung— Geben Sie den Namen für Ihre Verbindung ein.AWS SCTzeigt diesen Namen in der Metadatenstruktur an.

    • Ordner für SSIS-Pakete— Wählen Sie den Pfad zu Ihrem SSIS-Projektordner mit Paketen.

    AWS SCTliest die Projektdateien (Dateien mit den Erweiterungen).dtsx,.conmgroder.params) aus dem lokalen Ordner und analysiert sie. Es organisiert sie dann zu einemAWS SCTBaum von Kategorien.

  4. Wählen SieZiel hinzufügenaus dem Menü, um eine neue Zielplattform hinzuzufügen, um Ihre SSIS-Quellpakete zu konvertieren.

  5. Wählen SieAWS Glueund vervollständigen Sie das Folgende:

    • Name der Verbindung— Geben Sie den Namen für Ihre Verbindung ein.AWS SCTzeigt diesen Namen in der Metadatenstruktur an.

    • Kopieren vonAWSProfil— Wählen Sie das zu verwendende Profil aus.

    • AWSZugriffstaste— Geben Sie Ihre einAWSZugangsschlüssel.

    • AWSgeheimer Schlüssel— Geben Sie Ihre einAWSgeheimer Schlüssel.

    • Region— Wählen Sie dieAWS-Regiondie Sie aus der Liste verwenden möchten.

    • Amazon S3-Bucket-Ordner— Geben Sie den Ordnerpfad für den Amazon S3-Bucket ein, den Sie verwenden möchten.

    Sie können eine virtuelle verwendenAWS GlueZiel. In diesem Fall müssen Sie die Verbindungsanmeldeinformationen nicht angeben. Weitere Informationen finden Sie unter Verwendung virtueller Ziele.

  6. Erstellen Sie eine neue Zuordnungsregel, die Ihr SSIS-Quellpaket und IhrAWS GlueZiel. Weitere Informationen finden Sie unter Neue Zuordnungsregel hinzufügen.

  7. Auf derAnsehenMenü, wählenHauptansicht.

  8. Öffnen Sie in der SSIS-Baumansicht das Kontextmenü (Rechtsklick) fürVerbindungsmanager, und wählen Sie dannVerbindungen konfigurieren.

  9. Konfigurieren Sie den Projektverbindungsmanager.

    Um eine Verbindungszuordnung für SSIS-Verbindungsmanager zu konfigurieren, geben Sie dieAWS GlueVerbindung für den entsprechenden SSIS-Verbindungsmanager. Stellen Sie sicher, dass IhrAWS GlueVerbindungen wurden bereits erstellt.

    1. UnterVerbindungen, wähleVerbindungen zum Projekt.

    2. FürKataloganschluss aufkleben, wähle das passendeAWS GlueVerbindung.

  10. Konfigurieren Sie den Paketverbindungsmanager:

    1. UnterVerbindungen, wählen Sie Ihr Paket.

    2. FürKataloganschluss aufkleben, wähle das passendeAWS GlueVerbindung.

    3. Wiederholen Sie diese Aktionen für alle Verbindungen, die für Ihr Paket verfügbar sind.

  11. Wählen Sie Apply (Anwenden) aus.

  12. Konvertiere dein Paket. Suchen Sie in der QuellbaumansichtPakete. Öffnen Sie das Kontextmenü (Rechtsklick) für Ihr Paket und wählen SiePaket konvertieren.

  13. Speichern Sie das konvertierte Skript in Amazon S3. Suchen Sie in der ZielbaumansichtSkripte verpacken. Öffnen Sie das Kontextmenü (Rechtsklick) für Ihr konvertiertes Skript und wählen SieIn S3 speichern.

  14. Konfiguriere deinAWS GlueBeruf. Suchen Sie in der ZielbaumansichtSkripte verpacken. Öffnen Sie das Kontextmenü (Rechtsklick) für Ihr konvertiertes Skript und wählen SiekonfigurierenAWS GlueAufgabe.

  15. Füllen Sie die drei Konfigurationsabschnitte aus:

    1. Schließe das abDatenfluss entwerfenAbschnitt:

      • Strategie zur Umsetzung— Wählen Sie aus, wie Ihr Job ETL-Skripts ausführen soll. Wählen SieSEQUENTIELLEum die Skripts in der Reihenfolge auszuführen, die im Assistenten angegeben ist. Wählen SiePARALLELum die Skripte parallel auszuführen, wobei die Reihenfolge, die im Wizard angegeben ist, ignoriert wird.

      • Skripte— Wählen Sie den Namen Ihres konvertierten Skripts.

      • Wählen Sie Weiter aus.

    2. Schließe das abEigenschaften des ArbeitsplatzesAbschnitt:

      • Name— Geben Sie den Namen IhresAWS GlueBeruf.

      • IAM-Rolle— Wählen Sie die IAM-Rolle aus, die für die Autorisierung von Ressourcen verwendet wird, die für die Ausführung des Jobs und den Zugriff auf Datenspeicher verwendet werden.

      • Name der Skriptdatei— Geben Sie den Namen Ihres konvertierten Skripts ein.

      • S3-Pfad der Skriptdatei— Geben Sie den Amazon S3-Pfad zu Ihrem konvertierten Skript ein.

      • Verschlüsseln Sie das Skript mit SSE-S3— Wählen Sie diese Option, um Daten mithilfe serverseitiger Verschlüsselung mit von Amazon S3 verwalteten Verschlüsselungsschlüsseln (SSE-S3) zu schützen.

      • Temporäres Verzeichnis— Geben Sie den Amazon S3-Pfad zu einem temporären Verzeichnis für Zwischenergebnisse ein.AWS GlueundAWS GlueIntegrierte Transformationen verwenden dieses Verzeichnis, um in Amazon Redshift zu lesen oder zu schreiben.

      • AWS SCTgeneriert automatisch den Pfad für Python-Bibliotheken. Sie können diesen Pfad überprüfen inGenerierter Python-Bibliothekspfad. Sie können diesen automatisch generierten Pfad nicht bearbeiten. Um zusätzliche Python-Bibliotheken zu verwenden, geben Sie den Pfad einPfad der Python-Bibliothek des Benutzers.

      • Pfad der Python-Bibliothek des Benutzers— Geben Sie die Pfade für zusätzliche Benutzer-Python-Bibliotheken ein. Trennen Sie Amazon S3-Pfade durch Kommas.

      • Pfad für abhängige Jars— Geben Sie die Pfade für abhängige JAR-Dateien ein. Trennen Sie Amazon S3-Pfade durch Kommas.

      • Pfad der referenzierten Dateien— Geben Sie die Pfade für zusätzliche Dateien ein, z. B. Konfigurationsdateien, die für Ihr Skript erforderlich sind. Trennen Sie Amazon S3-Pfade durch Kommas.

      • Maximale Kapazität— Geben Sie die maximale Anzahl vonAWS GlueDatenverarbeitungseinheiten (DPUs), die zugewiesen werden können, wenn dieser Job ausgeführt wird. Sie können eine Ganzzahl zwischen 2 und 100 eingeben. Der Standardwert ist 2.

      • Maximale Parallelität— Geben Sie die maximale Anzahl gleichzeitiger Läufe ein, die für diesen Job zulässig sind. Die Standardeinstellung ist 1.AWS Gluegibt einen Fehler zurück, wenn dieser Schwellenwert erreicht ist.

      • Zeitlimit für den Job (Minuten)— Geben Sie den Timeout-Wert für Ihren ETL-Job ein, um sich vor unerwarteten Jobs zu schützen. Der Standardwert für Batchaufträge beträgt 2880 Minuten (48 Stunden). Wenn der Job diesen Grenzwert überschreitet, ändert sich der Ausführungsstatus des Jobs inTIMEOUT.

      • Schwellenwert für verzögerte Benachrichtigungen (Minuten)— Geben Sie den Schwellenwert in Minuten zuvor einAWS SCTsendet eine Verzögerungsbenachrichtigung.

      • Anzahl der Wiederholungen— Geben Sie ein, wie oft (0—10)AWS Gluesollte den Job automatisch neu starten, falls er fehlschlägt. Jobs, die das Timeout-Limit erreichen, werden nicht neu gestartet. Der Standardwert ist 0.

      • Wählen Sie Weiter aus.

    3. Konfigurieren Sie die erforderlichen Verbindungen:

      1. VonAlle Verbindungen, wählen Sie das gewünschteAWS GlueVerbindungen und füge sie der Liste von hinzuAusgewählte Verbindungen.

      2. Wählen Sie Finish (Abschließen).

  16. Erstellen Sie ein konfiguriertesAWS GlueBeruf. Suchen und erweitern Sie in der ZielbaumansichtETL-Stellenangebote. Öffnen Sie das Kontextmenü (Rechtsklick) für den ETL-Job, den Sie konfiguriert haben, und wählen Sie dannErstellenAWS GlueBeruf.

  17. Führen Sie denAWS GlueBeruf:

    1. Öffnen Sie die AWS Glue-Konsole unter https://console.aws.amazon.com/glue/.

    2. Wählen Sie im Navigationsbereich die Option Jobs (Aufträge) aus.

    3. Wählen SieJob hinzufügen, und wählen Sie dann den Job aus, den Sie ausführen möchten.

    4. Auf derAktionenTabulator, wählenJob ausführen.

SSIS-Komponenten, dieAWS SCTkann konvertieren inAWS Glue

Du kannst benutzenAWS SCTum Datenfluss- und Kontrollflusskomponenten sowie Container, Parameter und Variablen zu konvertieren.

Zu den unterstützten Datenflusskomponenten gehören die folgenden:

  • ADO NET-Ziel

  • ADO NET-Quelle

  • Aggregate

  • Cache-Transformation

  • Transformation der Charakterkarte

  • Bedingte Split-Transformation

  • Spaltentransformation kopieren

  • Transformation der Datenkonvertierung

  • Abgeleitete Spaltentransformation

  • Excel-Ziel

  • Excel-Quelle

  • Spaltentransformation exportieren

  • Ziel für Flatfiles

  • Flatfile-Quelle

  • Fuzzy-Lookup-Transformation

  • Spaltentransformation importieren

  • Transformation nachschlagen

  • Zusammenführen An Transformation teilnehmen

  • Transformation zusammenführen

  • Multicast-Transformation

  • ODBC-Ziel

  • ODBC-Quelle

  • OLE DB-Befehlstransformation

  • OLE DB-Ziel

  • OLE DB-Quelle

  • Prozentuale Stichprobentransformation

  • Pivot-Transformation

  • Ziel der Raw-Datei

  • Rohdateiquelle

  • RecordSetZielort

  • Transformation der Zeilenanzahl

  • Transformation der Zeilenstichprobe

  • Transformation sortieren

  • SQL Server-Ziel

  • Vereinigung der gesamten Transformation

  • Transformation aufheben

  • XML-Quelle

Zu den unterstützten Control Flow-Komponenten gehören die folgenden:

  • Masseneinfügungsaufgabe

  • Aufgabe „Paket ausführen“

  • Aufgabe „SQL ausführen“

  • Aufgabe „T-SQL-Anweisung ausführen“

  • Ausdrucksaufgabe

  • Dateisystem-Aufgabe

  • Aufgabe „Bediener benachrichtigen“

  • E-Mail-Aufgabe senden

Zu den unterstützten SSIS-Containern gehören die folgenden:

  • Für Loop Container

  • Für jeden Loop-Behälter

  • Sequenzcontainer