Alle Kollektionen
Octoparse Performance
Daten Scraping von Seiteninformationen (Metadaten, Seiten-URL, Seitentitel, Quellcode)
Daten Scraping von Seiteninformationen (Metadaten, Seiten-URL, Seitentitel, Quellcode)
Vor über einer Woche aktualisiert

In diesem Tutorial erfahren Sie, wie Octoparse die Daten auf der Seitenebene extrahiert, die Metadaten, Seiten-URL, Seitentitel, Quellcode enthalten.

Schritt 1: Klicken Sie auf „Extract Data”.

Schritt 2: Klicken Sie auf „Add data field(s) “ in „Data Preview”.

Daten Scraping von Seiteninformationen( Metadaten, Seiten-URL, Seitentitel, Quellcode)_01

Schritt 3: Klicken Sie auf „Page-level data” und wählen die Daten, die Sie brauchen.

Dann die gewählten Daten werden im Datenfeld angezeigt.

Daten Scraping von Seiteninformationen( Metadaten, Seiten-URL, Seitentitel, Quellcode)_02

Schritt 4: Benennen Sie die Daten nach Badarf um.

Daten Scraping von Seiteninformationen( Metadaten, Seiten-URL, Seitentitel, Quellcode)_03


Bedeutung der Daten auf der Seitenebene:

  • Page URL[Seiten-URL]: Die URL der aktuellen Seite.

Es ist nützlich, wenn Sie die fehlenden Daten auf einer Seite überprüfen möchten: What to do with those blank fields I got in the extracted result? 

  • Page title[Seitentitel]: Der Text eines Titel in HMTL.

Daten Scraping von Seiteninformationen( Metadaten, Seiten-URL, Seitentitel, Quellcode)_04

Das ist eine kurze Beschreibung einer Webseite und erscheint oben im Browserfenster.

Daten Scraping von Seiteninformationen( Metadaten, Seiten-URL, Seitentitel, Quellcode)_05

  • Meta description[Meta-Beschreibung]: Der Inhalt des Meta-Beschreibung-Tags.

Daten Scraping von Seiteninformationen( Metadaten, Seiten-URL, Seitentitel, Quellcode)_06

Meta-Beschreibung ist eine kurze Zusammenfassung des Seiteninhalts.

  • Meta-Keyword: Der Inhalt des Meta-Keyword-Tags.

Daten Scraping von Seiteninformationen( Metadaten, Seiten-URL, Seitentitel, Quellcode)_07

Das Scraping des Seitentitels, der Meta-Description und der Meta-Keywords ist nützlich, wenn Sie Ihre SEO verbessern möchten.

  • HTML-Quellcode: der komplette HTML-Code der Webseite.

Hat dies Ihre Frage beantwortet?