undefined

Lektion 0: Grundlagen von Octoparse

Monday, May 24, 2021 12:20 PM

Hallo zusammen! Herzlich willkommen bei der brandneuen Octoparse-Version 8.5! Wir haben die wichtigste Veränderung der neuen Version zusammengefasst, um Ihnen zu helfen, die neue Funktionen zu entdecken und die Datenextraktion zu vereinfachen.


Nachdem Sie alle Einführungslektionen durchlaufen haben, werden Sie Octoparse 8.5 in- und auswendig kennen und in der Lage sein, Daten aus den meisten Webseiten mit Octoparse zu extrahieren. Es dauert etwa 30 bis 60 Minuten, bis Sie alle Lektionen durchgelesen haben. Viel Spaß!


Beginnen wir mit einer Einführung in das Interface und die Kernfunktionen der Software.

 

﹡ Die Startseite
﹡ Das Seitenleistenmenü
﹡ Der Arbeitsbereich

 

﹡ Verwenden von Aufgabenvorlagen
﹡ Scrapen Daten mit dem fortgeschrittenen Modus
﹡ Cloud-Extraktion

  

1. Das Interface
Sobald Sie sich bei Octoparse anmelden, werden Sie zwei Hauptbereiche finden: die Startseite (Home screen) und die Seitenleiste (Sidebar).

 

Das Interface in Octoparse

 


1.1 Die Startseite

Es gibt eine Suchleiste ganz oben auf der Seite, wo Sie die gewünschten Webseiten URL(s) eintreten können, um die Erstellung einer Aufgabe zu beginnen. Oder Sie können auch einen vollständigen Name (z.B. Amazon oder eBay) eintreten, um nach einer vorgefertigten Scraping-Vorlage zu suchen.

 

Startseite1

 

Startseite2

 

Sie können auch auf einige der beliebtesten Scraping-Vorlagen und Tutorials auf der Startseite zugreifen.

 

1.2 Das Seitenleistenmenü

Das Seitenleistenmenü auf der linken Seite enthält alles, was Sie zur Navigation in Octoparse benötigen.
· +New: erstellen/importieren eine neue Aufgabe oder erstellen neue Aufgabengruppen.

 

eine Aufgabe erstellen

 

· Dashboard: Der einzige Ort, um alle Ihre Scraping-Aufgaben zu verwalten. Bearbeiten, löschen, umbenennen und organisieren Sie alle Aufgaben in Ihrem Konto. Sie können auch bequem alle Aufgaben ausführen, stoppen oder planen.

 

Dashborad

 

· Support: Klicken Sie hier, und dann suchen Sie nach einem Tutorial oder starten ein kurzes Gespräch mit uns, wenn Sie Probleme hätten!

 

1.3 Der Arbeitsbereich

Der Arbeitsbereich ist der Ort, an dem Sie Ihre Aufgaben erstellen werden. Er ist in fünf Hauptbereiche unterteilt, wobei jeder Bereich einen bestimmten Zweck erfüllt.

 

Arbeitsbereich

 

· Der Built-in Browser: Sobald Sie die URL der Zielwebseite eingetreten haben, wird die Webseite in dem Built-in Browser geladen. Sie können die Webseite im Browse-Modus durchsuchen oder im Select-Modus die gewünschten Daten extrahieren.

· Tipps: Octoparse verwendet Smart Tipps, um während des Extraktionsprozesses mit Ihnen zu "sprechen", damit Octoparse Sie beim Prozess der Aufgabenerstellung führen kann.

· Der Workflow: Wenn Sie fortfahren, mit der Webseite zu interagieren, z.B. eine Webseite zu öffnen und auf ein Seitenelement/einen Button zu klicken, wird der gesamte Prozess automatisch in Form eines Workflows definiert.

· Settings: Settings-Optionen für die Aktionen in dem Workflow werden nach Ihrer Wahl einer Aktion gezeigt werden.

· Datenvorschau: Lassen Sie sich eine Vorschau der ausgewählten Daten anzeigen. Sie können die Datenfelder auch umbenennen oder die nicht benötigten entfernen.

 

 

 

2. Kernfunktionen

2.1 Aufgabenvorlagen

Aufgabenvorlagen sind für Benutzer*innen vorgefertigte Aufgaben, mit denen Benutzer*innen Daten durch Eingabe einfacher Parameter wie URL(s) oder Schlüsselwörter erhalten können. Derzeit gibt es über 60 Vorlagen für die meisten gefragten Webseiten. Man braucht nicht, selbst eine Aufgabe zu erstellen und keine technischen Kenntnisse sind dabei erforderlich. Wählen Sie einfach eine Vorlage aus, die Sie brauchen, und prüfen Sie die Beispieldaten, um zu sehen, ob sie die gewünschten Daten erhalten können, dann los geht’s!

 

Aufgabenvorlagen

 

 

2.2 Scrapen Daten mit fortgeschrittenem Modus

Im Gegensatz zu Aufgabenvorlagen, bei denen alles bereits voreingestellt ist, ist der Octoparse fortgeschrittene Modus ein hochflexibler und leistungsstarker Scraping-Modus, der es Ihnen ermöglicht, eine Ihren speziellen Anforderungen entsprechenden Scraping-Aufgabe zu erstellen. Der fortgeschrittene Modus ist genug, um komplizierte Webseiten zu scrapen, z.B. Seiten mit JavaScript, AJAX oder andere dynamische Webseiten.
Das Erstellen Ihrer eigenen Scraping-Aufgabe mit dem fortgeschrittenen Modus ist nicht kompliziert und einschüchternd. Mit dem neuen Auto-Detect-Algorithmus erkennt Octoparse automatisch Elemente auf einer Webseite und generiert empfohlene Aufgabeneinstellungen wie das Extrahieren der Liste und das Weitergehen zur nächsten Seite.

 

fortschrittes Modus

 

Zusätzlich zu den automatisch erkannten Daten können Sie die Aufgabeneinstellungen jederzeit manuell bearbeiten oder eine Aufgabe selbst erstellen, indem Sie den Schritt der automatischen Erkennung überspringen können.

 

fortschrittes Modus2

 

Wenn Sie mit den automatisch erkannten Daten zufrieden sind, speichern Sie einfach die Einstellungen und Octoparse wird den Aufgaben-Workflow automatisch generieren. Sie können dem Workflow bei Bedürfnissen zusätzliche Schritte hinzufügen oder die Aktionen manuell ändern, wenn es nötig ist.

 

2.3 Cloud-Datenextraktion

Octoparse bietet eine leistungsstarke Cloud-Plattform für Premium-Benutzer*innen (Standard oder höher), um Ihre Aufgaben 24/7 auszuführen. Wenn Sie eine Aufgabe mit „Cloud-Extraktion“ ausführen, läuft sie in der Cloud mit mehreren Servern unter Verwendung unserer IPs. Sie können die App oder Ihren Computer herunterfahren, während die Aufgabe ausgeführt wird. Sie müssen sich keine Gedanken über Hardware-Einschränkungen machen.

 

Die extrahierten Daten werden in der Cloud gespeichert und können jederzeit abgerufen werden. Erweiterte Funktionen wie automatische IP-Rotation, Aufgabenplanung, Beschleunigung der Extraktion und die Octoparse-API sind die Teile des Octoparse-Cloud-Services.

 

Gut, dass Sie es hierher geschafft haben! Sie haben sich bereits die Grundlagen von Octoparse angeeignet.
Um zu lernen, wie Sie Ihre erste Scraping-Aufgabe erstellen, fahren Sie bitte fort mit >>Lektion 1: Datenextraktion mit brandneuem Auto-Detect-Algorithmus

 

 

Autor*in: Das Octoparse Team
Diese Website verwendet Cookies um Ihnen ein besseres Internet-Erlebnis zu ermöglichen. Lesen Sie wie wir Cookies verwenden und Sie können sie kontrollieren, indem Sie auf Cookie-Einstellungen klicken. Wenn Sie die Website weiter nutzen, akzeptieren Sie unsere Verwendung von Cookies.
Akzeptieren Ablehnen