Detaillierte Informationen zum Seminar
Inhalte:
Daten sind der Rohstoff unserer Zeit. Mit Hilfe von Künstlicher Intelligenz sowie leistungsstarken Open Source Tools wie R lassen sich diese Daten finden, analysieren und im Marktforschungsalltag nutzen.
Obwohl die Menge hochwertiger und freier Daten über das Internet nahezu exponentiell wächst, bleibt es eine Herausforderung, diese für Marktforschungszwecke zu finden und im produktiven Prozess reproduzierbar verwenden zu können.
Dieses Seminar gibt Ihnen einen Überblick über offene Daten und ihre wesentlichen Fundstellen im Internet. Gemeinsam werden Wege erkundet, wie sich freie Daten für die Marktforschung nutzen lassen. Auch wird beispielhaft gezeigt, wie die leistungsstarke freie Software R das Mittel der Wahl ist, wenn es um das effiziente und reproduzierbare Heben der Datenschätze geht. Im Zusammenspiel mit den aktuellen LLMs (Large Language Models) wie ChatGPT eröffnen sich dabei ganz neue Möglichkeiten.
Hintergrund: Bislang gibt es keine umfassenden Suchmaschinen für freie Daten. Die Übersichtsportale von Institutionen und Organisationen erleichtern das schnelle Auffinden nur begrenzt. Es ist sehr aufwändig, sich einen guten Überblick zu verschaffen und auf dem Laufenden zu bleiben. Allein das EU-Open-Data-Portal führt über 1,2 Millionen freie Datensätze aus 36 europäischen Ländern auf, kategorisiert nach 13 Themenbereichen. Hat man erst einmal offene Daten für die eigene Fragestellung gefunden, überraschen die Vielfalt der Datenformate und die inhaltlichen Strukturen der Dateien. So liegen die Datensätze des EU-Portals in über 40 verschiedenen Formaten vor.
Viele offene Daten lassen sich mit den gängigen Office-Software-Produkten nur schwer verarbeiten. Hier kommen R, aber auch Python und KI-basierte Tools ins Spiel. Die Open Research Data Task Force der University of Warwick (UK) benannte 2017 daher treffend die beiden größten Herausforderungen für die Nutzung von offenen Daten: 1. die Daten zu finden, 2. ohne großen Aufwand zu nutzen. KI kann bei beiden Herausforderungen ein wertvolles Hilfsmittel sein.
Dauer/zeitlicher Ablauf:
09.30 - 18.00 Uhr
Ziele/Bildungsabschluss:
Freie Datenquellen im Internet finden und auf ihre maschinelle Nutzbarkeit für ihre Aufgabenstellungen in der Marktforschung beurteilen können,
die wesentlichen Strukturen relevanter Datenformate verstehen,
nachvollziehen können, wie sich offene Daten aus verschiedenen Quellen zusammenführen lassen und
verstehen, wie durch die Zusammenführung von Daten informatorischer Mehrwert entsteht,
die Einsatzmöglichkeiten von ChatGPT im Kontext freier Daten kennenlernen,
den Nutzen von allgemeinen, aber auch spezifischen R-Packages bei der Verwendung von webbasierten Daten einschätzen können,
die Möglichkeiten von Reporting und Kommunikation der Ergebnisse mit R überblicken,
verstehen, wie sich R im Zusammenspiel mit ChatGPT bei der Verwendung offener Daten effizienter nutzen lässt.
Zielgruppe:
Das Seminar richtet sich an Marktforscher/innen,
die sich einen Überblick über den aktuellen Stand von Open-Data verschaffen wollen und freie Daten für ihre Arbeit benötigen,
die wissen wollen, wie sich ein effizienter und reproduzierbarer Workflow in der Nutzung offener Daten aufbauen lässt,
Kenntnisse in R und RStudio sind nützlich, aber nicht erforderlich. Ebenso wäre ein eigener ChatGPT-Account hilfreich.
Seminarkennung:
H2026-34H