Der technologische Fortschritt hat die Welt im Sturm erobert – alles, was einst Teil unserer Vorstellungskraft war, ist heute Realität. Das Internet ist vollgepackt mit allem, was man braucht, von der Flut an Informationen und Daten bis hin zu Videos und Bildern. Da die Menge der online verfügbaren Daten jedoch groß ist, kann das Extrahieren und Herunterladen dieser Daten ein langwieriger Prozess sein. Unternehmen benötigen Daten in Form von Informationen, Zahlen, Bildern usw. – fast täglich.
Visuelle Darstellungen in Form von Bildern haben in dieser technikgetriebenen Welt an Popularität gewonnen; sie verbessern das Gesamtbild und die Ästhetik von allem sofort. Wir sind uns voll und ganz bewusst, dass zahlreiche verfügbare Tools und Software zur Datenextraktion die Arbeit sowohl für große als auch für kleine Unternehmen viel einfacher, billiger und schneller machen. Die Frage ist jedoch, ob es ein Tool, eine Software oder eine Methode gibt, mit der der mühsame Prozess des Herunterladens von Bildern aus der URL-Liste auch zugänglicher, billiger und schneller gemacht werden kann. Nun, lassen Sie uns diese Gelegenheit nutzen, um Ihnen allen zu sagen, dass es mit Sicherheit eine Möglichkeit gibt, mit der Sie problemlos eine große Menge an Bildern aus der URL-Liste herunterladen können. Ja, das haben Sie gelesen, richtig? Der Prozess ist mehr oder weniger ähnlich wie die Datenextraktionsmethode, mit leichten Änderungen hier und da. Lassen Sie uns also eintauchen und herausfinden, wie das geht. Lesen Sie weiter.
Was sollte man für Herunterladen der Bilder machen?
Um die Bilder von der URL herunterzuladen, benötigen Sie zwei bedeutende Sachen zu beachten:
- Erstens benötigen Sie ein Web Scraping Tool. Wir empfehlen unser Lieblingswerkzeug – Octoparse, da es ein visuelles und benutzerfreundliches Web Scraping Tool ohne Programmierkenntnisseforderung hat und sowohl für Windows als auch für MacOS geeignet ist;
- Zweitens hilft Ihnen TabSave, ein Chrome-Plugin, die Bilder sofort zu speichern, wenn Sie die URL-Liste angeben.
Und es ist auch ganz wesentlich für das Extrahieren und Herunterladen der Bilder, dass Sie sich daran erinnern müsste, dass nicht alle Bilder während des Prozesses gleich sind. Das bedeutet, dass einige Bilder direkt aus der Website abgeruft werden können. Im Gegensatz dazu sind die anderen Bilder nur durch den Klick auf die betreffenden Thumbnails heruntergeladen.
Wie kann Octoparse URLs von ausgewählten Bildern extrahieren?
Zunächst wollen wir herausfinden, wie man ein Bild direkt von einer Webseite extrahieren kann. Wenn Sie beispielerweise Bilder eines Sonnenuntergangs von Pexels.com scrapen möchten, würden Sie auf diese Webseite zugreifen und „Sonnenuntergang“ in die Suchleiste darauf eingeben, woraufhin sich die Seite mit den verschiedenen Bildern von Blumen öffnet. Jetzt würden Sie:
- Schritt 1: Klicken Sie auf „+Neu“, um eine neue Aufgabe im erweiterten Modus zu erstellen.
- Schritt 2: Geben Sie die URL der ausgewählten Webseite in das Textfeld ein.
- Schritt 3: Klicken Sie auf „Starten“.
Super! Bisher ist der erste Teil des Prozesses abgeschlossen, jetzt werden Sie auf einer anderen Seite ankommen. Wir müssen die Software mitteilen, welche Bilder sie scrapen soll. Also,
- Schritt 1: Geben Sie ein Schlüsselwort in den Kasten ein. Dann klicken Sie auf den „Suche“ Button auf der Website.
- Schritt 2: Klicken Sie auf das erste Bild. Der „Tipps“ lautet nun, „Image selected and 12 similar images found“ – das bedeutet, dass wir die richtige Einrichtung gefunden haben und entlang des genauen Weges gehen.
- Schritt 3: Gehen Sie zu Auswählen und wählen Sie „Alle auswählen“.
- Schritt 4: Danach klicken Sie auf „URLs der ausgewählten Bilder extrahieren“.
Da wir die Bilder von mehreren Seiten und nicht nur von einer einzelnen Seite wollen, müssen wir manuell die Einstellung vom Loop-Modus verändern. Zuerst richten Sie „Seite durchblättern“ als Loop-Modus ein, um die Bilder von mehreren Seiten abzurufen. Gleichzeitig können Sie auch die Anzahl der Wiederholung für das Scrollen einstellen.
Bevor Sie Ihren Web Scraper/Crawler starten, müssen Sie sich über eine letzte Sache im Klaren sein: Wenn der HTML-Quellcode beim Herunterscrollen aktualisiert wird oder wenn die Webseite nicht vollständig heruntergescrollt wird, werden die entsprechenden Bild-URLs nicht heruntergeladen. Dies ist einer der Hauptgründe, warum wir zu Octoparse tendieren, da es schnell automatisch scrollt. Bitte stellen Sie sicher, dass Sie den automatischen Bildlauf beim ersten Zugriff auf die Website und beim nächsten Seitenwechsel aktivieren. Um dies zu tun, müssen Sie:
- Schritt 1: Wählen Sie „Zur Webseite gehen“ aus dem Workflow aus. Auf der rechten Seite des Arbeitsablaufs befinden sich „Erweiterte Optionen“.
- Schritt 2: Aktivieren Sie das Kontrollkästchen „Scrollen Sie bis zum Ende der Seite“, wenn das Laden beendet ist.
Sie können sogar die Anzahl der Scrollvorgänge und die Geschwindigkeit festlegen. Mit Octoparse können Sie einen einzelnen Bildschirm 40 Mal nach unten blättern, wobei zwischen jedem Bildlauf eine Sekunde vergeht. Prüfen Sie die Einstellung, die für Sie am besten geeignet ist; möglicherweise müssen Sie sie entsprechend ändern.
Perfekt! Alles ist in Ordnung. Jetzt müssen Sie nur noch Ihren Crawler überprüfen und ausführen, um sicherzustellen, dass er ohne Fehler funktionieren kann. Klicken Sie dazu einfach in der oberen rechten Ecke des Bildschirms auf „Starten“. Wählen Sie „Auf Ihrem Gerät ausführen“, d. h. Sie führen den Crawler auf Ihrem eigenen Gerät sowie System und nicht auf dem Cloud-Server aus. Außerdem können Sie auch diese Methode verwenden, um die Bilder von Google oder Chrome herunterzuladen. Das war’s!
Scrapen der Bilder in voller Größe
Die Methode zum Scrapen eines Bildes in voller Größe ist etwas anders. Wir werden dasselbe Beispiel des Herunterladens von Bildern der Blumen aus pexels.com verwenden, um Ihnen zu erklären, wie Sie ein Bild in voller Größe herunterladen können.
- Schritt 1: Starten Sie eine neue Aufgabe und klicken Sie auf „+Neu“ auf der linken Seitenleiste.
- Schritt 2: Geben Sie die URL der ausgewählten Webseite in das Textfeld ein und klicken Sie dann auf „Starten“, um fortzufahren.
- Schritt 3: Klicken Sie einzeln auf das Bild, um das Bild in voller Größe zu extrahieren.
- Schritt 4: Nach einem Klick auf das erste Bild sollte der Aktionstipp „Bild ausgewählt, 18 ähnliche Bilder gefunden“ anzeigen, und dann klicken Sie auf „Alle auswählen“.
- Schritt 5: Wählen Sie nun „Schleife Klick auf jedes Bild“, wodurch Sie auf die Seite mit allen Bildern in voller Größe mitbringen.
Klicken Sie einfach auf das Bild in voller Größe und wählen Sie „URL des ausgewählten Bildes extrahieren“, und klicken Sie auf „Zur Webseite gehen“, wählen Sie die Schaltfläche „Nächste Seite“ und selektieren Sie danach „Schleife hat den ausgewählten Link angeklickt“ unter „Tipps“.
Fertig nun! Führen Sie gleich Ihre einge Aufgabe auf Ihrem Gerät durch! Ein perfekter Web-Scraping-Weg fängt mit Interesse und Glück an.
Zusammenfassung
Zusammenfassend lässt sich sagen, dass mit der Kombination von Tools wie Octoparse und dem TabSave-Plugin Benutzer effizient und ohne Programmierkenntnisse eine große Anzahl von Bildern aus Webseiten extrahieren und herunterladen können. Dies spart nicht nur Zeit und Kosten für Unternehmen, sondern erleichtert auch die tägliche Bilderfassung. Wenn Sie noch auf der Suche nach einer bequemen Methode zur Datenerfassung sind, sollten Sie diese Methode ausprobieren und eine ganz neue Art der Datenerfassung beginnen!
👍👍 Wenn Sie Interesse an Octoparse und Web Scraping haben, können Sie es zunächst 14 Tage lang kostenlos ausprobieren.
Wenn Sie Probleme bei der Datenextraktion haben, oder uns etwas Vorschlägen geben möchten, kontaktieren Sie bitte uns per E-Mail (support@octoparse.com). 💬
Konvertiere Website-Daten direkt in Excel, CSV, Google Sheets und Ihre Datenbank.
Scrape Daten einfach mit Auto-Dedektion, ganz ohne Coding.
Scraping-Vorlagen für beliebte Websites, um Daten mit wenigen Klicks zu erhalten.
Mit IP-Proxys und fortschrittlicher API wird nie blockiert.
Cloud-Dienst zur Planung von Datenabfragen zu jedem gewünschten Zeitpunkt.