Wie zu verwenden
- Schritt 1: Klicken Sie auf „Versuchen!“.
- Schritt 2: Legen Sie die maximale Linktiefe fest - wie tief der Scraper von den in den Start-URLs angegebenen Webseiten abtauchen soll. Bei Null wird der Scraper ausschließlich die Start-URLs crawlen, ohne sich auf Unterseiten zu wagen.
- Schritt 3: Legen Sie die maximale Anzahl der Seiten fest - ein Limit für die Gesamtzahl der zu scrapenen Webseiten.
- Schritt 4: Legen Sie fest, ob der Scraper innerhalb der Domain bleiben soll oder nicht - wenn ja, folgt der Scraper nur Links auf derselben Domain wie die verweisende Seite. Wenn der Scraper zum Beispiel https://www.domain-b.com/some-page auf https://domain-a.com/some-page findet, wird er die Seite nicht crawlen, da sie sich auf einer anderen Domain befindet.
- Schritt 5: Klicken Sie auf „Starten“, um Ihren bevorzugten Ausführungsmodus zu wählen.
Datenvorschau
Start_URL | Domain | Depth | Referrer_URL | Current_URL | Emails | Phones | Uncertain_Phones | Twitter | YouTube | Facebook | LinkedIn | Instagram | Tiktok |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
https://www.octoparse.com | www.octoparse.com | 0 | https://www.octoparse.com | https://www.octoparse.com | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/privacy-policy | support@octoparse.com;isabel@octoparse.com;u003eisabel@octoparse.com | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | |||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/black-friday-sale-2023?utm_source=sitebanner&utm_medium=opsite&utm_campaign=23bf | https://twitter.com/intent/tweet?text=Get%20your%2030%25%20OFF%20offer%20in%20Octoparse%20Black%20Friday%20Sale,%20November%2015-30,%202023%20(EST)%20time-limited.&url=https://www.octoparse.com/black-friday-sale-2023?refid=711 | https://www.linkedin.com/cws/share?url=https://www.octoparse.com/black-friday-sale-2023?refid=711 | |||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/ | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/download | someone@example.com | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | |||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/pricing | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/customer-stories | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/blog | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/terms-and-conditions | support@octoparse.com;u003esupport@octoparse.com | (800) 952-5210;(916) 445-1254 | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. |
Notizen
- Um Leads von einer bestimmten Website zu erhalten, sollten Sie zunächst eine Website-spezifische Vorlage verwenden.
- Dieser Scraper ist eine erweiterte Version einer früheren Vorlage, die sich auf E-Mail- und Social-Media-Links konzentriert, aber jetzt tiefer in Unterseiten eindringen kann.
- Die folgenden Kontaktinformationen werden extrahiert: E-Mails, Telefonnummern, unsichere Telefonnummern, YouTube-, Tiktok-, LinkedIn-, Twitter-, Facebook- und Instagram-Profile.
- 4) Die Profile der sozialen Medien werden aus den Links im HTML-Code extrahiert.
- Aufgrund von Website-Einschränkungen dürfen die Start-URLs keine Facebook- oder Instagram-Links enthalten.
- Diese Vorlage kann KEINE Kontaktdaten auslesen, die nicht in der HTML-Quelle enthalten sind. Für Social-Media-Profile werden nur anklickbare Links erkannt.
Ist Scraping Contact Details legal?
Web Scraping ist im Allgemeinen legal, wenn Sie öffentlich zugängliche, nicht personenbezogene Daten auslesen. Was Sie mit den Daten machen, ist eine andere Frage. Dokumentation, Hilfeartikel oder Blogs sind in der Regel urheberrechtlich geschützt, sodass Sie den Inhalt nicht ohne die Erlaubnis des Eigentümers veröffentlichen dürfen. Erfahren Sie mehr über die Rechtmäßigkeit von Web Scraping in diesem Artikel. Wenn Sie sich nicht sicher sind, wenden Sie sich bitte an einen professionellen Rechtsberater.