Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Aufbau eines skalierbaren Web-Crawling-Systems auf AWS
In diesem Abschnitt wird beschrieben, wie der im Abschnitt beschriebene Webcrawler erstellt wird. Architektur Es beinhaltet einen systematischen Ansatz zur Erstellung eines soliden Datensatzes von Unternehmen und den zugehörigen Webeigenschaften. Dieser Datensatz dient als Grundlage für Ihre Crawling-Aktivitäten. Anschließend wird in diesem Abschnitt beschrieben, wie Sie einen ethischen Webcrawler in erstellen Python.