Google Play ist eine gute Webseite, um Bewertungen von mobilen Anwendungen zu sammeln. Die Bewertungen können nicht nur den Nutzern beim Entscheiden helfen, welche App zu herunterladen, sondern auch die Entwickler dazu anregen, ihre Apps zu verbessern.
In diesem Tutorial erfahren Sie, wie man die Bewertungen von Anwendungen aus Google Play extrahiert.
Lösung 1: Verwenden Sie einfach die Aufgabenvorlage für Google Play auf dem Template von Octoparse.

Lösung 2: Erstellen Sie Ihre eigne Aufgabe für die Daten-Scraping von Google Play.
In diesem Teil erfahren Sie deutliche Hinweise über den Ablauf einer Erstellung der Daten-Scraping-Aufgabe. Damit ist eine URL als Beispiel herausgegeben und die Zieldaten beziehen sich um Benutzernamen, Bewertungszeit und Bewertungsinhalt von jeder APP.
Hier ist ein Überblick über die Schritte.
Schritt 1: „Go To Web Page” - Öffnen Sie die Ziel-Webseite.
• Geben Sie die URL auf der Startseite ein und klicken Sie auf „Start”.

Schritt 2: Erstellen Sie einen Workflow nach der automatische Detektion der Webseite.
• Klicken Sie auf „Auto-detect web page data” und warten Sie, bis die Detektion abgeschlossen ist.

• Deaktivieren Sie „Add a page scroll”.
• Wählen Sie „Create workflow” in „Tipps”.

• Löschen Sie die unerwünschten Datenfelder und benennen Sie bei Bedarf die Feldnamen um.

Schritt 3: Aktivieren Sie „Scroll down the page after it is loaded” von „Go to Web Page”.
• Klicken Sie auf „Go to Web Page” im Workflow.
• Klicken Sie auf „Options”.
• Kreuzen Sie „Scroll down the page after it is loaded” an und erstellen Sie die Male von „Scroll Repeats” auf 4 und die Wartezeit auf 4s
• Klicken Sie auf „Apply” zum Bestätigen.

Schritt 4: Modifizieren Sie XPath von dem Button „Show More”, um mehr Bewertungen darstellen zu lassen.
• Klicken Sie auf „Loop Item”.
• Geben Sie XPath ein: //span[text()='Show More']/..

• Klicken Sie auf „Click on a Load More button”.
• Erstellen Sie den Wert von „AJAX Load” auf 5s.

• Der ganze Workflow sieht wie folgend aus.

Tipps!
Hier erfahren Sie mehr über XPath.
Schritt 5: Fügen Sie ein „Branch” hinzu, falls die Bewertung gefaltet angezeigt wäre.
Falls die Bewertung gefaltet angezeigt wäre, dann ist ein Klicken auf „Full Review” benötigt. Aber dies ist nicht allgemein bei jeder Bewertung, deshalb soll man ein „Branch” erstellen, um diese zwei Fälle zu unterscheiden.
• Fügen Sie „Branch Conditions” hinzu im Loop Item 1.

• Klicken Sie auf „Left Branch”.
• Wählen Sie „Execute if the current loop contains specific text”.
• Geben Sie den Text „Full Review” ein.
• Klicken Sie auf „Apply” zum Bestätigen.

• Kopieren Sie die „Extract Data” Aktion.

• Klicken Sie auf „Left Branch” und kleben die „Extract Data” Aktion.

Dann modifizieren Sie XPath von Bewertungsinhalt um den vollen Intalt zu lokalisieren und extrahieren.
• Klicken Sie auf die abgekopierte „Extract Data” Aktion.
• Gehen Sie zum Data Review.
• Klicken Sie auf „More” und wählen Sie „Customize XPath”.

• Geben Sie XPath ein. //span[@style="display: none;"]
• Klicken Sie auf „Apply” zum Bestätigen.

• Kopieren Sie die „Extract Data” Aktion auf „Right Branch”.
Der ganze Workflow sieht wie folgend aus.
Schritt 6: Scraping starten, um die Aufgabe auszuführen und Daten zu erhalten.
• Klicken Sie auf „Save”.
• Klicken Sie auf „Run”.
• Wählen Sie „Run on your device”, um die Aufgabe mit Ihrem lokalen Gerät auszuführen, oder wählen Sie „Run in the Cloud”, um die Aufgabe auf unseren Cloud-Servern auszuführen (nur für Premium-Benutzer)

Hier ist eine Datenausgabe als Beispiel.
Autor*in: Das Octoparse Team