Konfiguration eines Crawlers

Ein Crawler greift auf Ihren Datenspeicher zu, identifiziert Metadaten und erstellt Tabellendefinitionen im. AWS Glue Data Catalog Im Bereich Crawler in der AWS Glue Konsole sind alle Crawler aufgeführt, die Sie erstellen. In der Liste werden Status und Metriken aus der letzten Ausführung Ihres Crawlers angezeigt.

Dieses Thema behandelt den step-by-step Prozess der Konfiguration eines Crawlers und behandelt wichtige Aspekte wie das Einrichten der Crawler-Parameter, das Definieren der zu durchforstenden Datenquellen, das Einrichten der Sicherheit und das Verwalten der gecrawlten Daten.

Themen

Schritt 1: Festlegen der Crawler-Eigenschaften
Schritt 2: Auswahl von Datenquellen und Classifier
Schritt 3: Konfigurieren der Sicherheitseinstellungen
Schritt 4: Festlegen von Ausgabe und Zeitplanung
Schritt 5: Überprüfen und Erstellen

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Klassifikatoren auf der Konsole erstellen

Crawler-Eigenschaften festlegen