logo
languageDEdown
menu

Erhalten des XPath für Web Scraping bei Chrome oder Firefox

2 Minuten lesen

Was ist XPath?

XPath ist eine Sprache, die zum Auffinden bestimmter Elemente in XML-Dokumenten verwendet wird. Einer der Hauptgründe für die Verwendung von XPath ist, dass Sie bestimmte Daten nicht direkt auf der Webseite finden können. Da HTML Teil der XML-Familie ist, können Sie XPath auch in HTML verwenden.

Web Scraping mit XPath ist notwendig, um genaue Daten zu extrahieren. Wenn Sie nicht den richtigen XPath online verwenden oder den richtigen XPath falsch verwenden, werden Sie nicht in der Lage sein, die benötigten Daten zu extrahieren. Eigentlich kann man mit Hilfe von Chrome oder Firefox einfach den benötigten XPath finden, aber man muss durch einigen Erweiterungen geholfen werden, um den XPath schneller zu erhalten.

Im Zusammenhang mit Web Scraping ist XPath ein nützliches Tool, das Ihnen hilft, einen Pfad zu einer bestimmten Stelle im HTML-Code zu finden und alles zu extrahieren, was Sie dort finden können.

In diesem Artikel zeige ich Ihnen, wie Sie XPath verwenden können, um Websites zu scrapen und wertvolle Daten zu extrahieren, die Sie für SEO-Kampagnen, Social-Media-Kampagnen, Content Marketing usw. verwenden können.

Finden des XPath bei Chrome & Firefox

Das erste, was Sie tun müssen, ist, Firefox oder Chrome zu installieren.

Firefox

Wenn Sie den Firefox-Browser verwenden, müssen Sie das Plugin, Firebug, installieren, um den XPath zu sehen.

(Hinweis: FireBug wird verwendet, um den HTML/SCC eines beliebigen Elements auf einer Webseite einfach nachzuschlagen, so dass es sehr einfach ist, Webseiten zu debuggen und zu entwickeln).

Wenn Sie eine Webseite in Firefox öffnen, klicken Sie auf den Firebug Button und dann auf ein Element auf der Seite, das Sie untersuchen möchten. Daraufhin wird der gesamte XPath angezeigt.

Oder Sie können einfach mit der rechten Maustaste auf die Seite klicken und die Option “Inspect in FirePath” wählen.

Klicken Sie mit der rechten Maustaste auf die Zeile und wählen Sie “XPath kopieren”.

Chrome

Wenn Sie Chrome verwenden, klicken Sie mit der rechten Maustaste auf die Webseite und wählen Sie “Inspect”. Daraufhin wird der HTML-Code angezeigt. Jede Zeile dieses HTML hat ihren eigenen XPath. Sie können jede Zeile aus- oder einklappen.

Klicken Sie dann einfach mit der rechten Maustaste auf die Zeile und wählen Sie “XPath kopieren”.

Verwendung des XPath zur speziellen Datenextraktion

Eine der wirklich genialen Sachen ist, dass Sie XPath direkt in Octoparse ausführen können.

Wenn Sie diese Zeile extrahieren möchten, kopieren Sie den XPath und fügen Sie ihn in das integrierte XPath-Tool ein.

So können Sie ganz einfach die gewünschten Daten extrahieren.

Hier bekommen Sie Octoparse! 🤩

Preis: $0~$249 pro Monat

Packet & Preise:Octoparse Premium-Preise & Verpackung

Kostenlose Testversion: 14-tägige kostenlose Testversion

Herunterladen:Octoparse für Windows und MacOs

Wenn Sie Probleme bei der Datenextraktion haben, oder uns etwas Vorschlägen geben möchten, kontaktieren Sie bitte uns per E-Mail (support@octoparse.com). 💬

Autor*in: Das Octoparse Team ❤️

Themen untersuchen

Starten mit Octoparse heute

Download

Verwandte Artikel