Seminare
Seminare

Einführung in Data Science mit Python für Anfänger:innen

Seminar - Cegos Integrata GmbH

Datenkompetenz zählt heute zu den zentralen Schlüsselqualifikationen in nahezu allen Branchen - insbesondere im Umgang mit großen Datenmengen und der Entwicklung datenbasierter Entscheidungsgrundlagen.  

In diesem dreitägigen Seminar erhalten Sie einen praxisorientierten Einstieg in Data Science mit Python. Sie lernen, Daten mit Python einzulesen, aufzubereiten, zu analysieren und mit gängigen Bibliotheken anschaulich zu visualisieren. Auf dieser Grundlage bekommen Sie einen überblicksartigen Einstieg in ausgewählte Machine-Learning-Verfahren, ohne dass dafür eine tiefgehende mathematische Herleitung im Vordergrund steht.

Das Seminar ist speziell für Einsteiger:innen konzipiert, die erste Erfahrungen im Umgang mit Daten mitbringen und den Data-Science-Ansatz sowie die praktische Arbeit mit Python kennenlernen möchten.

Nach dem Seminar sind Sie in der Lage, Daten selbstständig aufzubereiten, zu analysieren und erste Modelle des maschinellen Lernens in Python anzuwenden - eine wertvolle Grundlage für Ihre weitere Entwicklung im Bereich Data Science.

Dieses Seminar ist Teil dieses Qualifizierungsplaners:

Data Scientist

Termin Ort Preis*
16.03.2026- 18.03.2026 online 2.320,50 €
20.04.2026- 22.04.2026 online 2.320,50 €
29.06.2026- 01.07.2026 online 2.320,50 €
01.07.2026- 03.07.2026 online 2.320,50 €
19.08.2026- 21.08.2026 Stuttgart 2.320,50 €
19.08.2026- 21.08.2026 online 2.320,50 €
30.09.2026- 02.10.2026 online 2.320,50 €
16.11.2026- 18.11.2026 online 2.320,50 €
16.11.2026- 18.11.2026 Düsseldorf 2.320,50 €
firmenintern auf Anfrage auf Anfrage

Alle Termine anzeigen

*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

Grundlegende Konzepte in Python:

  • Installation neuer Pakete
  • Verwendung von JupyterLab und .ipynb als Entwicklungsumgebung (IDE)
  • Unterschiede in Funktionen und Methoden
  • Vergleich wichtiger Python-Aspekte mit anderen Programmiersprachen

Arbeiten mit dem pandas-Paket und DataFrames:

  • Struktur eines DataFrames (Zeilen, Spalten)
  • Auswahl von Zeilen und Spalten
  • Erstellen, Löschen und Ändern von Zeilen und Spalten
  • Verwendung von Boolean-Indexing zur Zeilenauswahl anhand logischer Abfragen
  • Zusammenfassung von Daten für einen Überblick

Berechnung von Statistiken direkt in pandas DataFrames:

  • Durchführung einfacher Statistiken direkt auf DataFrames (Durchschnitt, Minimum, Maximum, Summe, Median, Varianz usw.)
  • Aggregation und Filterung von Daten
  • Ersetzen von fehlenden Werten
  • Erstellung von Kreuztabellen (Kontingenztabellen)

Datenverarbeitung: Einlesen und Schreiben von Daten:

  • Festlegung des Arbeitsverzeichnisses in Python und der IDE Spyder
  • Einlesen und Schreiben von CSV- und Excel-Dateien
  • Datenimport von einer URL
  • Übersicht über nützliche Parameter
  • Lesen und Schreiben im Python-Format pickle
  • Handhabung großer Datensätze

Kontrollstrukturen:

  • Erstellung eigener Funktionen
  • Festlegung von Standardparametern in Funktionen (Positional Arguments und Keyword Arguments)
  • Anwendung von For-Schleifen
  • Implementierung von If-Else-Bedingungen
  • Verwendung von List Comprehensions mit If-Else

Datenvisualisierung mit seaborn/matplotlib:

  • Grundlegende Aspekte von matplotlib
  • Anpassung von Achsenbeschriftung, Legende und Titel
  • Speichern von Diagrammen
  • Erstellung von Diagrammtypen wie Linien-, Box-, Histogramm-, Scatter- und Balkendiagrammen in seaborn
  • Variation oder Festlegung von Darstellungsmerkmalen (Punktgröße, Farbe, Gruppierung) durch eine Variable

Textmanipulation im DataFrame und Einführung in numpy:

  • Zeilenweise Textbearbeitung in DataFrames
  • Extraktion von Informationen aus Texten
  • Erstellung von numpy-Arrays und Slicing nach Zeilen und Spalten
  • Anwendung von Funktionen auf numpy-Arrays

Überblick über Machine Learning:

  • Einführung in das Konzept des Machine Learnings
  • Praktische Anwendungsbeispiele
  • Unterscheidung von künstlicher Intelligenz, Machine Learning und Deep Learning
  • Erklärung des Unterschieds zwischen überwachtem und unüberwachtem Lernen
  • Besprechung von Overfitting, Train-Test-Split und Kreuzvalidierung

Entscheidungsbaum mit scikit-learn:

  • Datenaufteilung in Test- und Trainingsdaten, Modellerstellung und Validierung
  • Grundlagen des Entscheidungsbaum-Algorithmus
  • Umsetzung in Python
  • Ergebnisvalidierung (u. a. Verwirrungsmatrix, Sensitivität, Genauigkeit)
  • Anpassung von Hyperparametern während des Trainings

Neuronales Netz und K-Nearest Neighbor:

  • Grundlagen dieser Algorithmen
  • Training eines Multi-Layer-Perceptrons (MLP)
  • Umsetzung in Python mit scikit-learn
  • Ergebnisvalidierung (u. a. Verwirrungsmatrix, Sensitivität, Genauigkeit)
  • Anpassung von Hyperparametern

K-Means Clustering:

  • Erstellung und Validierung eines Cluster-Modells
  • Grundlagen des K-Means-Algorithmus
  • Umsetzung in Python mit scikit-learn
  • Ergebnisvalidierung

Clustering mit DBSCAN:

  • Funktionsweise des DBSCAN-Clustering-Algorithmus
  • Worin liegt der Unterschied zu K-Means?
  • Umsetzung in Python mit scikit-learn
  • Ergebnisvalidierung (Sillhouette Score, Calinski-Harabasz)
Dauer/zeitlicher Ablauf:
3 Tage
Teilnahmevoraussetzungen:
  • Für eine erfolgreiche Teilnahme sollten Sie grundlegende mathematische Kenntnisse (z. B. Mittelwerte, Varianz, einfache Funktionen, Normalverteilung) und eine gewisse Vertrautheit im Umgang mit Daten mitbringen, etwa durch die Arbeit mit Excel-Auswertungen oder Berichten.
  • Erste Programmiererfahrung ist hilfreich, aber keine zwingende Voraussetzung, da zentrale Python-Grundlagen im Seminar eingeführt werden.
  • Englischkenntnisse auf Lesekompetenzniveau sind notwendig, da viele Fachbegriffe, Bibliotheksnamen und Teile der Dokumentation in englischer Sprache vorliegen.
Lehrgangsverlauf/Methoden:
Neben einer Vielzahl von Programmieraufgaben haben die Teilnehmer:innen die Möglichkeit, diese Aufgaben eigenständig mit Unterstützung der Trainer:innen in Python zu lösen. Das Ziel ist es, das Gelernte zu festigen und zu vertiefen. Bei individuellen Unklarheiten stehen die Trainer:innen direkt zur Verfügung, um Fragen zu beantworten. Es stehen Aufgaben mit unterschiedlichen Schwierigkeitsgraden zur Verfügung, sodass Sie die Inhalte Schritt für Schritt vertiefen und an Ihren eigenen Lernstand anpassen können.  

Im Seminar werden in jedem Block (meistens ca. 90 Minuten lang) sowohl theoretische als auch praktische Einheiten behandelt. Die theoretischen Einheiten dienen dazu, das notwendige Wissen zu vermitteln, um die Übungsaufgaben zu verstehen und eigenständig lösen zu können. Dabei konzentrieren wir uns auf den theoretischen Stoff, der das Verständnis verbessert und vermeiden ausführliche, wissenschaftliche Theorieeinheiten. Der Schwerpunkt liegt auf der praktischen Anwendung, also dem Schreiben von Code und dem Lösen von kleinen Verständnisaufgaben. Teilnehmer:innen können jederzeit Fragen stellen, die während der praktischen Einheiten individuell von den Trainerinnen und Trainern beantwortet werden. Fragen von allgemeinem Interesse werden allen Teilnehmenden erklärt. Sie erhalten die Theorie und weitere Code-Erklärungen als PDF und gedruckte Version. Codebeispiele und Musterlösungen der Übungsaufgaben sind in digitaler Form verfügbar.  

Die Übungen bestehen hauptsächlich aus Coding-Aufgaben, bei denen Sie entweder kurze Codebeispiele schreiben oder Lücken in vorhandenem Code ergänzen müssen. Letzteres fördert das Verständnis für Code. Die Aufgaben sind so gestaltet, dass sie von allen Teilnehmern innerhalb der verfügbaren Zeit gelöst werden können. Es stehen Aufgaben mit unterschiedlichen Schwierigkeitsgraden zur Verfügung, sodass Sie die Inhalte Schritt für Schritt vertiefen und an Ihren eigenen Lernstand anpassen können. Darüber hinaus gibt es für einige Kapitel kurze Kontrollfragen zum theoretischen Teil. 
Zielgruppe:
  • Der Kurs richtet sich an Fachkräfte, die Python erlernen möchten, um Datenanalysen durchzuführen und Machine-Learning-Algorithmen zu programmieren.
  • Besonders geeignet für Anwender:innen, die die Grundlagen der Data Science kennenlernen möchten, wie z. B. Datenanalystinnen und -analysten, IT-Spezialistinnen und -Spezialisten sowie Ingenieurinnen und Ingenieure.
  • Berufseinsteiger:innen im Bereich Data Science, die einen praxisorientierten Einstieg suchen.
Seminarkennung:
54411
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha