undefined

Umgang mit Paginierung (mit Button „Mehr Laden“)

Thursday, June 23, 2022 3:26 PM
Viele Websites verwenden einen Button von „Mehr laden“ oder „Weiter anzeigen“, um Inhalte kontinuierlich zu laden. Diese Technik wird bei den Websites viel verwendet, die für Benutzer/innen eine bessere Erfahrung anbieten möchten.

 

Mehr laden Button

 

Im Vergleich zur Paginierung mit einem Button von „Weiter“ fügen Websites mit „Mehr laden“ kontinuierlich mehrere Inhalte auf einer einzelnen Webseite hinzu, was das Web Scraping schwieriger macht. In diesem Artikel zeige ich Ihnen, wie Sie mit dem Button „Mehr laden“ in Octoparse umgehen können.

 

 

Vielleicht brauchen Sie diesen Link als Beispiel zu probieren:

 

 

Methode 1 Verwendung des Auto-Detect mit Button „Mehr laden“

Schritt 1: Starten Sie den Prozess von Auto-Detect und dann würden Sie die Option „Click on a ‚Load More‘ button“ in der Tipps-Platte.

 

Click on a ‚Load More‘ button

 

Schritt 2: Klicken Sie auf „Check“ zu sehen, ob der Button „Mehr laden“ schon richtig lokalisiert wurde. Wenn noch nicht, können Sie auf „Edit“ klicken, um den rechten Button auszuwählen.

 

operation

 

Schritt 3: Klicken Sie auf „Edit“, um „Number of clicks“ einzustellen, was bedeutet, wie viele Male Sie auf den Button „Mehr laden“ klicken möchten.

 

number of clicks setting

 

Schritt 4: Klicken Sie auf „Create workflow“, um die Eintsllungen zu generieren.
Der Workflow sollte wie das folgende Bild aussehen:

 

Create workflow

 

Mit dem Workflow würde Octoparse auf den Button „Mehr laden“ klicken, während die Daten auch gescrapt werden. Wenn „Number of clicks“ bereits die Nummer 20 eingestellt wurde und es nach Ihrem Klick 20 neue Items geladen sind, würde Octoparse jedes Mal 20 neu geladenen Items mit jedem Klick auf „Mehr laden“.

 

 

Methode 2 Erstellung einer Paginierung manuell

Schritt 1: Selektieren Sie den Button „Mehr laden“ auf der Webseite und dann wählen Sie „Loop click single elemet“.
Schritt 2: Stellen Sie einen ordentlichen AJAX-Timeout (Was ist AJAX?).

 

operation

 

Tipps!
1. Wenn Sie den Button „Mehr laden“ nur X-mal anklicken wollen, klicken Sie auf das Einstellungssymbol von „Pagination“. Dann kreuzen Sie „Repeats“ an und setzen Sie „Repeats“ auf die Zahl X.

 

pagination

 

2. Wenn Sie es versuchen, dass die Aufgabe zahlreiche Duplikate während des Scraping erhält, können Sie das Loop Item aus der Paginierung ziehen, sodass Octoparse starten könnte, nach dem Laden alle Items zu scrapen.

 

operation

 

Wenn Sie Probleme bei der Datenextraktion haben, oder uns etwas Vorschlägen geben möchten, reichen Sie bitte uns eine Anfrage ein. Erfüllen Sie eine Anfrage hier. Oder Sie können durch E-Mail (support@octoparse.com) uns kontaktieren.

 

 

Autor*in: Das Octoparse Team

 

Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen