Daten Scraping aus einem Tab
Friday, June 10, 2022 5:10 PMAuf vielen Webseiten sind mehre Informationen durch Klicken auf ein Tab angezeigt. Deswegen wenn Sie die Daten aus einem bestimmten Tab extrahieren möchten, lesen Sie bitte das Tutorial duch. Mit einem Beipiel erfahren Sie, wie die Datenextraktion aus dem Tab realisiert ist.
Hier ist eine Webseite als Beispiel mit URL: https://www.nastygal.com/denim-check-mixed-spliced-oversized-shirt/AGG14204.html?color=103
Die Daten sollen aus Tab „Shipping and Returns” und „Size Guide” extahiert werden.

Überblick
Schritt 1: Erledigen Sie zuerst eine Klicken-Einstellung auf Tab.
• Klicken Sie auf „Shipping and Returns”.
• Wählen Sie „Click element“ auf „Tips”.
• Machen Sie eine AJAX-Einstellung.
• Dann klicken Sie auf die zu erfassenden Daten und wählen Sie „Extract the text of the element” auf „Tips”.
Tipps!
• Erfahren Sie die Hinweise über AJAX hier.
• Die Einstellung „Open in a new tab” von „Click element” darf nicht geöffnet werden.
Schritt 2: Extrahieren Sie die Daten aus Tab.
Hier sind zwei Situationen zu überlegen.
Situation 1: Die Daten sind direkt zu sehen in den Quellencoden ohne Klicken auf Tab .
In dieser Situation ist die Klicken-Einstellung wie oben angedeutet nicht mehr benötigt. Sie können die Daten direkt extrahieren.
Situation 2: Die Daten sind nur nach dem Klicken auf Tab anzuschauen.

In dieser Situation gehen Sie zum Schritt 1 zurück und machen Sie die Einstellung wie folgend:
• Schalten Sie den Button „Browse” an und öffnen Sie die „Browse mode”
.

• Klicken Sie auf Tab „Shipping and Returns”, um den Inhalt in voller Form darzustellen.
• Schalten Sie den Button „Browse” zu und öffnen Sie die „Workflow mode”.
• Klicken Sie auf die zu extrahierenden Daten und wählen Sie „Extract the text of the element” auf „Tips”.
• Dann haben Sie die Aufgabe erledigt.
Autor*in: Das Octoparse Team