Alle Kollektionen
Praktische Einführung
E-Commerce
Scraping der Bewertungen von Google Play
Scraping der Bewertungen von Google Play
Vor über einer Woche aktualisiert

Google Play ist eine gute Website, um Bewertungen von mobilen Anwendungen zu sammeln. Die Bewertungen können nicht nur den Nutzern beim Entscheiden helfen, welche App zu herunterladen, sondern auch die Entwickler dazu anregen, ihre Apps zu verbessern.

In diesem Tutorial werden wir Ihnen zeigen, wie man die Bewertungen von Anwendungen aus Google Play scrapen.

Sie können unsere "Aufgabenvorlage" auf dem Startbildschirm des Octoparse besuchen. Alles, was Sie brauchen, ist die Eingabe einiger Parameter und die Aufgabe ist fertig. Für weitere Details, schauen Sie bitte hier nach: Aufgabenvorlage

mceclip0.png

Zum Nachvollziehen können Sie diese URL im Tutorial verwenden:

Wir werden Daten wie Benutzernamen, Bewertungszeit und Bewertungsinhalt von jeder APP mit Octoparse scrapen.

Die Website verwendet unendliches Scrollen, um weitere Bewertungen zu laden. Nachdem wir die Seite etwa 4 Mal nach unten gescrollt haben, würde einen „Mehr anzeigen“-Button auftauchen und wenn wir weiterhin Rezensionen laden möchten, müssen wir auf den Button klicken und dann kann die Seite wieder 4 Mal nach unten scrollen.

Hier sind die wichtigsten Schritte in diesem Tutorial. [Aufgabendatei hier herunterladen]


1. Öffnen Sie die Ziel-Webseite

  • Geben Sie die URL auf der Startseite ein und klicken Sie auf „Start“.

gp1.png


2. Automatische Detektion der Webseite, um Schritte zur Texteingabe zu erstellen

  • Klicken Sie auf „Auto-detect the web page data“ und warten Sie, bis die Detektion abgeschlossen ist.

mceclip3.gif

  • Überprüfen Sie die Datenfelder in der Datenvorschau, und Sie können auch die unerwünschten Felder löschen oder Felder umbenennen, falls erforderlich.

mceclip3.gif

  • Klicken Sie auf "Edit" unter der Option "Add page scroll" in Tipps

  • Stellen Sie die Wartezeit auf 4-5 Sekunden ein (Stellen Sie sicher, dass die Zeit lang genug ist, damit die Seite neue Bewertungen laden kann)

  • Klicken Sie im Tipps-Bedienfeld auf "Create workflow".

mceclip16.png
  • Überprüfen Sie die Datenfelder in der Datenvorschau, und dann können Sie auch die unerwarteten Felder löschen oder nach Anforderungen umbenennen.

mceclip0.gif


3. Modifizieren Sie „Go to Web Page“ beim Hinzufügen „Scroll down the page after it is loaded“

  • Klicken Sie auf „Go to Web Page“ im Workflow.

  • Gehen Sie zur Options

  • Klicken Sie „Scroll down the page after it is loaded“ und richten Sie die Anzahl von „Scroll Repeats“ als 4, „wait time“ als 4s ein (weil der „load more“ button erst angezeigt wird, nachdem wir vier Mal nach unten gescrollt haben)

  • Klicken Sie auf „Apply“

scroll_down.jpg


4. Modifizieren Sie den XPath von Loop Element 1- Lokalisieren Sie den Button"Show More"

  • Öffnen Sie die Einstellungen von „Loop Item1“.

  • Geben Sie den XPath //span[text()='Show More']/.. ein.

modify_Xpath.jpg

  • Klicken Sie auf „Click on a Load More button“.

  • Erstellen Sie „AJAX Load“ als 5s.

AJAX.jpg

Der endliche Workflow sollte wie folgend ausgesehen werden:

mceclip10.png

Tipps!

Wenn Sie mehr über XPath erfahren möchten, schauen Sie sich bitte das folgende Tutorial an: Was ist XPath und wie man es in Octoparse verwendet.


5. Speichern und starten, um die Aufgabe auszuführen und Daten zu erhalten

  • Klicken Sie auf „Save“.

  • Klicken Sie auf „Run“.

  • Wählen Sie „Run on your device“, um die Aufgabe mit Ihrem lokalen Gerät auszuführen, oder wählen Sie „Run in the Cloud“, um die Aufgabe auf unseren Cloud-Servern auszuführen (nur für Premium-Benutzer).

mceclip11.png


Hier sind Daten für die Beispielaufgabe.

mceclip12.png
Hat dies Ihre Frage beantwortet?