Daten Scraping von IFrame
Vor über einer Woche aktualisiert

Was ist IFrame?

Ein IFrame (Inline Frame) ist ein HTML-Dokument, das in ein anderes HTML-Dokument auf einer Webseite eingebettet ist. Es ermöglicht Ihnen, ein Stück Inhalt aus externen Quellen aufzunehmen. Im Wesentlichen ist es ein Fenster auf Ihrer Webseite, das einen anderen Online-Inhalt betrachtet.

Codemäßig enthält jeder Iframe das <iframe> HTML-Tag sowie ein Quellattribut src, das den Speicherort des Inhalts angibt, den Sie einbetten möchten.

<iframe src="URL"></iframe>

IFrames sind nützlich für eine deutliche Trenung zwischen einer Webseite und den externen Inhalten. Die können auch als Wegdirektion für Daten-Extraktion gelten.


IFrame und Octoparse

Der integrierte Browser von Octoparse erkennt IFrame automatisch, so dass Sie nur die Elemente im IFrame auswählen und normalerweise extrahieren müssen.

Wenn Sie Daten in einem IFrame extrahiert haben, überprüfen Sie das automatisch generierte Element XPath, um festzustellen, ob Octoparse sie bereits erkannt hat.

Daten Scraping von IFrame_01

Beachten Sie jedoch, dass Octoparse die Elemente in IFrames mit der Kombination von IFrame XPath und Matching XPath lokalisiert. Wenn der automatisch generierte XPath nicht genau ist, müssen Sie beide XPath-Ausdrücke neu editieren.


Erkennt Octoparse den IFrame nicht automatisch?

Für das Problem gibt es zwei Lösungen.

Lösung 1: Extrahieren Sie ein beliebiges Element auf der Webseite in den Datenfelder. Dann editieren Sie XPath wiedermal, um das IFrame-Element zu finden. Vergessen Sie bitte nicht, den IFrame XPath und Matching XPath damit einzugenben.

Lösung 2: Erhalten Sie zuerst die IFrame Adresse, die Sie später als Starting URL in einer neue Aufgabe anwenden.

  • Schritt 1: Drücken Sie F12 oder Ctrl + Shift + I, um die Developer Tools in Chrome zu öffnen und den Quellcode des IFrame-Elements zu suchen.

  • Schritt 2: Klicken Sie mit der rechten Maustaste auf <iframe src>Tag und kopieren Sie die Link-Adresse, um die URL zu erhalten.

  • Schritt 3: Verwenden Sie die URL, um eine Aufgabe zu erstellen.

Daten Scraping von IFrame_02
Hat dies Ihre Frage beantwortet?