Alle Kollektionen
Praktische Einführung
E-Commerce
Scraping der Produktinformationen von Tokopedia (Version 8.4)
Scraping der Produktinformationen von Tokopedia (Version 8.4)
Vor über einer Woche aktualisiert

Tokopedia ist eine indonesische Technologie-Firma, die sich auf die Branche von E-Commerce konzentriert. In diesem Tutorial zeigen wir Ihnen, wie Sie Produktinformationen, wie z.B. Produkttitel, Preis und Bewertung auf Tokopedia sammeln können.

Für Data Scraping von Tokopedia können Sie unsere vorgestellte Aufgabenvorlage verwenden, die auf der Startseite liegt. Oder können Sie einfach diesem Tutorial folgen, um Ihre eigene Aufgabe von Anfang an zu erstellen.

sto.gif

Wir verwenden die Suchergebnis-URL unten für das Beispiel.

Hier sind die hauptsächlichen Schritte in diesem Tutorial. [Herunterladen Demo-Aufgabe hier: Aufgabe 1/Aufgabe 2]


Aufgabe 1 - Extrahieren URLs des Produktes

Schritt 1: Öffnen Sie die Ziel-Webseite

  • Geben Sie die URL und klicken Sie auf „Start“.

mceclip0.png


Schritt 2: Automatische Erkennung der Daten aus Webseiten

  • Wählen Sie „Auto-detect web page data“ auf der Tipps-Panel.

mceclip8.png

  • Nachdem die automatische Erkennung abgeschlossen ist, wählen Sie „Edit“ unter „Add a page scroll“ aus.

Add_page_scroll.jpg

  • Stellen Sie die Anzahl von „Repeats“ als 3 ein und klicken Sie dann auf „Comfirm“. Danach selektieren Sie „Create workflow“.

scroll_repeat.jpg

  • Gehen Sie zur Datenvorschau - Löschen Sie alle Felder außer den Seite-URLs, indem Sie auf ... klicken, das sich neben der Felder-Kopfzeile befindet.

mceclip11.png


Schritt 3: Erstellen Sie Pagination

  • Klicken Sie auf den Nächsten Button auf der Webseite.

  • Klicken Sie auf „Button“ unten der Tipps

Create_pagination_1.jpg

  • Wählen Sie „Loop click single button“ aus.

create_pagination2.jpg


Schritt 4: Checken Sie den Workflow

Folgend liegt der entgültige Workflow. Wenn alles in Ordnung ist, können Sie weiter die Aufgabe ausführen.

mceclip6.png


Schritt 5: Ausführung der Aufgabe und Exportieren der Daten

  • Klicken Sie auf „Run“, was ganz oben rechtes liegt, um Ihre Aufgabe auszuführen: Wählen Sie „Run task on your device“ zur Ausführung auf Ihrem eigenen Gerät.

(Notiz: Wegen der komplizierten Anti-Scraping-Technik in dieser Webseite könnte Ihre Aufgabe nicht in der Cloud ausführen.)

mceclip7.png


Aufgabe 2 - Extrahieren Daten aus Detailseiten

Schritt 1: Erstellen einer neuen Aufgabe

  • Selektieren Sie „Advanced Mode“ oben links. Dann wählen Sie „Import from file“ und importieren Sie die Excel-Datei, die wir aus dem vorherigen Crawler exportiert haben. Schließlich lokalisieren Sie den richtigen „Sheet“ und „Column“ - Speichern und weiteres Gehen.

mceclip1.png


Schritt 2: Datenextraktion aus Produktsseite

  • Klicken Sie auf beliebigen Text aus der Seite und selektieren Sie „Extract the text of the selected element“.

sto.gif

  • Gehen Sie zur Datenvorschau - Klicken Sie doppelt auf die Kopfzeilen zum Umbennen der Datenfelder.

sto.gif


Schritt 3: Überprüfen Sie den Workflow

Folgend liegt der entgültige Workflow. Wenn alles in Ordnung ist, können Sie weiter die Aufgabe ausführen.

mceclip2.png


Schritt 4: Ausführung der Aufgabe und Exportieren der Daten

  • Klicken Sie auf „Run“, was ganz oben rechtes liegt, um Ihre Aufgabe auszuführen: Wählen Sie „Run task on your device“ zur Ausführung auf Ihrem eigenen Gerät.


Hier sind Daten für die Beispielaufgabe.

mceclip12.png
Hat dies Ihre Frage beantwortet?