logo
languageDEdown
menu

Einfaches Web-Scraping mit Google Tabellen

3 Minuten lesen

Kann man in Google Tabellen (eng. Google Sheets) Web-Scraping durchführen? Diese Frage stellen Sie sich vielleicht auch, denn Google Tabellen ist mittlerweile eines der beliebtesten cloudbasierten Tools. Eigentlich kann Google Tabellen als einfacher Web Scraper betrachtet werden. Sie können eine spezielle Formel verwenden, um Daten aus Websites zu extrahieren, die Daten direkt in Google Tabellen zu importieren und sie mit anderen zu teilen.

Option 1: Erstellen eines einfachen Web Scrapers mit ImportXML in Google Tabellen

✅ Schritt 1: Öffnen Sie eine neue Google Tabellen.

✅ Schritt 2: Öffnen Sie die Ziel-Website mit Chrome. Zum Erklären nehmen wir die Website „https://steamspy.com/“ als Beispiel. Klicken Sie mit der rechten Maustaste auf die Website und ein Dropdown-Menü wird angezeigt. Wählen Sie dann “Inspect”. Drücken Sie eine Kombination aus drei Tasten: „Ctrl“ + „Shift“ + „C“, um „Selektor“ zu aktivieren. Das Inspektion-Panel wird dann die Informationen des ausgewählten Elements erhalten.

✅ Schritt 3: Kopieren Sie die Website-URL und fügen die in der Google Tabelle ein.

Option 2: Extrahieren der Preisdaten mit einer einfachen Formel: ImportXML

✅ Schritt 1: Kopieren Sie den Xpath der Daten.

◽️ Wählen Sie die Preisdaten aus und klicken mit der rechten Maustaste, um das Dropdown-Menü aufzurufen.

◽️ Wählen Sie dann „Copy“, dann „Copy Xpath“ .

✅ Schritt 2: Geben die folgende Formel in die Tabelle ein.

=IMPORTXML(“URL”, “XPATH expression”)

Option 3: Sammeln der Daten mit anderer Formel von Google

Tabellen

Hier ist die Formel als Anlternative zu verwenden.

=IMPORTHTML(“URL”, “QUERY”, Index)

Mit dieser Formel können Sie die gesamte Tabelle extrahieren.

Option 4: Automatische Extraktion mit Scraping Tool–Octoparse

Sehen wir uns nun an, wie dieselbe Scraping-Aufgabe mit dem Web Scraper Octoparse einfach erledigt werden kann. Mit Octoparse können Sie mehr Daten aus Websites extrahieren als mit Google Tabellen, und Sie müssen keine Programmierkenntnisse erlernen, da das Programm über einen automatischen Erkennungsmodus verfügt. Octoparse funktioniert sowohl auf Windows- als auch auf Mac-Geräten. Laden Sie es herunter und folgen Sie den unten stehenden Schritten, um es zu nutzen.

Octoparse ist als ein benutzerfrendliches und leistungsstarkes Scraping Tool entwickelt. Im Vergleich zu Google Tabellen ist es mehr einfach, die Daten ohne Programmierung oder Formel zu extrahieren. Anschauend wird eine Extraktion-Aufgabe mit Octoparse als Beispiel genommen, damit Sie es ein besseres Verständnis bekommen.

Zuerst gibt es einen Film über Web Scraping mit Octoparse.

Schritte zum Scrapen der Daten

✅ Schritt 1: Öffnen Sie Octoparse, und erstellen eine neue Aufgabe, indem Sie auf „+ Task“ unter dem „Advanced Mode“ klicken.

✅ Schritt 2: Geben Sie dann die URL der Ziel-Website ein, dann klicken auf „Save URL“. In diesem Fall können Sie die Website des Beispiels benutzen: http://steamspy.com/

✅ Schritt 3: Beachten Sie, dass die Website jetzt in der interaktiven Ansicht von Octoparse angezeigt wird. Wir müssen eine Aktion „loop list“ erstellen, damit Octoparse die Daten der Liste scrapen kann.

◽️ Klicken Sie auf die Daten von einer Tabellenzeile (es kann eine beliebige Datei innerhalb der Tabelle sein) .Octoparse wird dann die ähnlichen Daten automatisch erkennen und sie rot hervorheben.

◽️ Wir sollen die Daten zeilenweise extrahieren, deswegen wählen wir „TR“ (Table Row) im Bedienfeld.

◽️ Nachdem eine Zeile ausgewählt wurde, wählen Sie „Select all sub-element” im Tipps.

Wählen dann „Select All“, um alle Zeilen auszuwählen.

✅ Schritt 4: Wählen „Extract data in the loop“, um die Daten zu extrahieren.

Sie können die Daten in Excel, CSV, TXT oder andere gewünschte Formate exportieren. Octoparse vermeidet das manuelle Kopieren und Einfügen, und automatisiert den Scraping-Prozess. Außerdem kann Octoparse Daten aus den dynamischen Websites mit AJAX-Technik oder reCaptcha besser scrapen.

Hier bekommen Sie Octoparse! 🤩

Preis: $0~$249 pro Monat

Packet & Preise:Octoparse Premium-Preise & Verpackung

Kostenlose Testversion: 14-tägige kostenlose Testversion

Herunterladen:Octoparse für Windows und MacOs

Wenn Sie Probleme bei der Datenextraktion haben, oder uns etwas Vorschlägen geben möchten, kontaktieren Sie bitte uns per E-Mail (support@octoparse.com). 💬

Autor*in: Das Octoparse Team ❤️

Themen untersuchen

Starten mit Octoparse heute

Download

Verwandte Artikel

  • avatarNeela Schmidt
    Einleitung Das Web Scraping, also die Extraktion von Da […]
    13. Juni 2023 · 5 Minuten lesen
  • avatarChristel Kiesel
    Google APIs ermöglichen Entwicklern den programmgesteuerten Zugriff auf das riesige Datenuniversum, die Dienste und Tools von Google. Durch die Integration von Google APIs in Ihre Web-Scraping-Workflows können Sie Ihre Datenextraktionsfähigkeiten verbessern.
    23. März 2023 · 5 Minuten lesen
  • avatarChristel Kiesel
    Auf Twitter behalten #earthquake und #erdbeben in den letzten 24 Stunden Top-Sitzen. Aber wie sprechen unsere Medien über Erdbeben in Türkei? Wir brauchen eine Daten Unterstützung für die Medien-Analyse. Viele deutsche Medien haben viele Nachrichten gepostet. Bei Google Search mit Schlüsselwort"erdbeben türkei" sind insgesamt 2,56Millionen verwante Nachrichten angezeigt. Was wir wissen möchten, ist nur die Anzahl der Nachrichten in 24 Stunden, damit können wir die Haltung der inländischen Massenmedien deutlich durchschauen. Hier bietet Octoparse Daten Service einen Datenbericht zu Forschungzwecken.
    07. Februar 2023 · 3 Minuten lesen
  • avatarChristel Kiesel
    Die meisten haben bestimmt diesen Begriff, Web Scraping, gehört. Wissen Sie aber wirklich, was Web Scraping bedeutet? Eigentlich gibt es viele Arten von Webseiten, damit wir unterschiedliche Methoden verwenden sollten, um die Daten aus Webseiten auszulesen. Hier stelle ich Data Scraping von Javascript Webseite vor.
    21. Dezember 2022 · 2 Minuten lesen