Daten Scraping von Seiteninformationen( Metadaten, Seiten-URL, Seitentitel, Quellcode)
Friday, June 10, 2022 4:45 PMIn diesem Tutorial erfahren Sie, wie Octoparse die Daten auf der Seitenebene extrahiert, die Metadaten, Seiten-URL, Seitentitel, Quellcode enthalten.
Schritt 1: Klicken Sie auf „Extract Data”.
Schritt 2: Klicken Sie auf „Add data field(s) “ in „Data Preview”.

Schritt 3: Klicken Sie auf „Page-level data” und wählen die Daten, die Sie brauchen.
Dann die gewählten Daten werden im Datenfeld angezeigt.

Schritt 4: Benennen Sie die Daten nach Badarf um.

Bedeutung der Daten auf der Seitenebene:
• Page URL[Seiten-URL]: Die URL der aktuellen Seite.
Es ist nützlich, wenn Sie die fehlenden Daten auf einer Seite überprüfen möchten: What to do with those blank fields I got in the extracted result?
• Page title[Seitentitel]: Der Text eines Titel in HMTL.

Das ist eine kurze Beschreibung einer Webseite und erscheint oben im Browserfenster.

•Meta description[Meta-Beschreibung]: Der Inhalt des Meta-Beschreibung-Tags.

Meta-Beschreibung ist eine kurze Zusammenfassung des Seiteninhalts.
• Meta-Keyword: Der Inhalt des Meta-Keyword-Tags.

Das Scraping des Seitentitels, der Meta-Description und der Meta-Keywords ist nützlich, wenn Sie Ihre SEO verbessern möchten.
• HTML-Quellcode: der komplette HTML-Code der Webseite.
Autor*in: Das Octoparse Team