Lektion 5: Erhalten der Daten
Tuesday, June 21, 2022 3:50 PMJetzt haben Sie Ihre erste Scraping-Aufgabe erstellt und vollständig getestet. Sie können nun die Aufgabe ausführen, um einige echten Daten zu extrahieren.
Übersicht
Schritt 1 Zwei Möglichkeiten zum Erhalten der Daten
Es gibt gemeinsam zwei Möglichkeiten, wie Sie die Aufgabe ausführen können:
• Ausführen auf Ihrem Gerät (auch bekannt als Lokal-Datenextraktion)
• Ausführen in der Cloud (auch bekannt als Cloud-Datenextraktion)
Möglichkeit 1
Wenn Sie eine Aufgabe auf Ihrem Gerät ausführen, müssen Sie während des Extraktionsvorgangs die Octoparse-App öffnen lassen. Es wird ein Extraktionsfenster darin geben, und Sie können beobachten, wie die Daten extrahiert werden, und warten darauf, bis der Vorgang abgeschlossen ist.
Möglichkeit 2
Wenn Sie dagegen eine Aufgabe in der Cloud ausführen, wird die Aufgabe auf der Octoparse-Cloud-Plattform ausgeführt, d.h. Sie können die Octoparse-App oder sogar Ihren Computer ausschalten und danach Ihre Daten abholen, wenn die Aufgabe erledigt ist. Die in der Cloud ausgeführten Aufgaben laufen im Allgemeinen 4- bis 12-mal schneller im Vergleich zu Lokal-Extraktionen, was von Ihren Projektanforderungen abhängig ist. Sie können immer einen Plan wählen, der für Sie geeignet ist.
Tipps!
Einige Aufgaben haben zwei Optionen, die jeweils „Standard Mode“ und „Boost Mode“ sind. Und die Optionen sind für die beiden Möglichkeiten Lokal-Datenextraktion und Cloud-Datenextraktion geeignet. Sie können die Unterschiede zwischen den zwei Modi in diesem Tutorial anschauen: Welche Unterschiede gibt es zwischen „Standard Mode“ und „Boost Mode“?(Englisch)
Schritt 2 Eine Ausführung starten
Sobald Sie mit der Erstellung Ihrer Aufgabe fertig sind, können Sie auf den Button „Run“ klicken, um eine Ausführung zu starten.
Alternativ können Sie auch auf die Aufgabe im Dashboard zugreifen und die Buttons „Run/Stop“ verwenden, um eine Aufgabe zu starten/stoppen.
Schritt 3 Ihre Daten überprüfen
Nachdem die Ausführung Ihrer Aufgabe abgeschlossen ist, können Sie Ihre Daten überprüfen.
Gehen Sie zum Dashboard und finden Sie Ihre Aufgabe. Schweben Sie über eine große Menge von gescrapten Zeilen und klicken darauf, um die gescrapten Daten von der neuesten Ausführung zu überprüfen. Klicken Sie auf „All Data“, um die von allen Ausführungen gescrapten Daten zu checken.
Sie können Ihre Daten auch überprüfen, indem Sie auf das Symbol „...“ auf dem Dashboard klicken. Dann selektieren Sie „View Data“ und wählen, „Cloud Data“ oder „Local Data“ anzusehen.
Schritt 4 Ihre Daten exportieren
Wenn die Daten gut aussehen, können Sie die Daten direkt exportieren, indem Sie auf „Export Data“ klicken, das in der unteren rechten Ecke vom Datenansicht-Tab liegt. Octoparse unterstützt den Export von Daten in Excel-, CSV- oder HTML-Dateien oder in eine Datenbank.
Tipps!
• Die in den Cloud extrahierten Daten kann auf jedem Gerät zugegriffen werden, solange Sie sich in Ihrem Konto anmelden.
• Cloud-Datenextraktion werden nur für 3 Monate gespeichert, danach werden sie von den Cloud-Servern entfernt. Denken Sie bitte an den Export der Daten, bevor sie entfernt werden.
• Lokal-Datenextraktion können nur auf dem Gerät zugegriffen werden, auf dem die lokale Extraktion ausgeführt wurde.
Funktioniert die Aufgabe nicht gut? Schauen Sie sich die FAQs unten an.
Autor*in: Das Octoparse Team