November 27, 2024 (1:00 PM - 1:45 PM)
Bei unserer Arbeit im CDL stoßen wir immer wieder auf Anfragen zum Thema “Web Scraping”. Oft sprechen wir mit Organisationen, die diesen Begriff irgendwo aufgeschnappt haben und sich davon eine Erleichterung ihrer Arbeit erhoffen, ohne wirklich zu wissen, was genau sich dahinter verbirgt.
Gemeinsam mit Benjamin von der DSSG Berlin wollen wir Licht ins Dunkel bringen! Der Input ist für Einsteiger\*innen geeignet und beschäftigt sich u.a. mit Fragen wie:
- Was versteht man unter “Web Scraping”?
- Was ist der Unterschied zum “Web Crawling”?
- Wie steigt man am besten ein? Was braucht es dafür?
- Was sind Vorteile und Möglichkeiten? Was sind Limitierungen?
Ziel des Inputs ist es, die Teilnehmenden in die Lage zu versetzen, grundlegend beurteilen zu können, ob der Ansatz des Web Scraping für ihre Fragestellung geeignet ist. Anhand verschiedener Anwendungsbeispiele soll versucht werden, realistische Erwartungen an das Verfahren zu skizzieren.
**Ausblick:** Anfang 2025 planen wir einen [aufbauenden Hands-on-Workshop](https://community.civic-data.de/content/perma?id=7568), der die theoretischen Grundlagen praktisch vertieft.
Hazem Adel (er/ihm) ·