Alle Kollektionen
Praktische Einführung
E-Commerce
Scraping der Produktbewertungen von Amazon
Scraping der Produktbewertungen von Amazon
Vor über einer Woche aktualisiert

Sie folgen jetzt einem Tutorial für die neueste Version von Octoparse. Wenn Sie zur Zeit eine ältere Version verwenden, empfehlen wir Ihnen kräftig es, ein Upgrade zu machen, weil sie schneller, leichter und stärker ist! Herunterladen und Installierung eines Upgrades hier, wenn Sie nicht so bereits machen!

Online-Rezensionen können nicht nur dem Käufer helfen, das richtige Produkt zu wählen, sondern auch dem Verkäufer helfen, sein Produkt und seinen Service zu verbessern. In diesem Tutorial zeigen wir Ihnen, wie man die Daten von Amazon.com scrapen kann.

Für Produkte-Scraping in Amazon können Sie unsere vorgestellte Vorlage verwenden, die auf der Startseite liegt, oder diesem Tutorial folgen, um die Aufgabe von Anfang an zu erstellen.

mceclip0.png

Hier sind die wichtigsten Schritte in diesem Tutorial. [Sie können hier die Aufgabendatei herunterladen]


Schritt 1: „Go To Web Page“ - Öffnen Sie die Ziel-Webseite

  • Geben Sie die URL auf der Startseite ein und klicken Sie auf „Start“.

mceclip0.png


Schritt 2: Klicken Sie auf den Button „See all reviews“.

  • Scrollen Sie auf der Seite nach unten, um den Button „See all reviews“ zu finden

  • Klicken Sie darauf und wählen Sie „Klicken URL“ in den Aktion-Tipps.

mceclip3.png


Schritt 3: Detektieren die Webseite automatisch, um den Workflow zu generieren

  • Selektieren Sie „Auto-detect web page data“.

mceclip4.png

  • Warten Sie auf die Detektion - Kreuzen Sie nicht „Add a page scroll“ an - Klicken Sie auf „Create workflow“.

mceclip6.png

Tipps!

Manchmal kann es vorkommen, dass Sie sich mit einer Roboter-Detektion treffen, der die Eingabe eines Sicherheitscodes verlangt. In diesem Fall können Sie auf den „Neu laden„ Button klicken, um die Seite zunächst neu zu laden. Wenn es immer noch nicht funktioniert, können Sie versuchen, in den Browsermodus zu wechseln, indem Sie auf den Button oben rechts im integrierten Browser klicken. Und geben Sie dann den Code ein, um die Detektion zu bestehen. Klicken Sie abschließend auf , um wieder in den Auswahlmodus zu wechseln.


Schritt 4: Einstellung der AJAX-Wartezeit in der Aktion „Click to Paginate“

  • Klicken Sie auf „Click to Paginate“, um das Timeout als 10s einzustellen.

fasfaf.gif


Schritt 5: Überprüfen Sie Daten und Workflow

  • Gehen Sie zur Datenvorschau, um zu überprüfen, ob die aktuellen Daten extrahiert werden. Klicken Sie doppelt auf die Kopfzeile, um das Feld umzubennen oder klicken Sie auf ... zum Löschen eines Feldes.

asdasds.gif

  • Der endgültige Workflow sieht wie folgend aus. Wenn alles in Ordnung ist, können Sie weiter gehen, um Ihre Aufgabe auszuführen.

mceclip0.png


Schritt 6: Extraktion ausführen - Ihre Aufgabe ausführen und Daten erhalten

  • Klicken Sie auf „Run task on your device“, um die Aufgabe auf Ihrem eigenen Gerät auszuführen, oder wählen Sie „Run task in the cloud“, um sie in der Cloud auszuführen (nur für Premium-Benutzer).

Hier sind Daten für die Beispielaufgabe.

mceclip8.png

Hat dies Ihre Frage beantwortet?