Seminare
Seminare

Data Scientist Intensivkurs - Bootcamp in Python, Data Science und Machine Learning - Online

E-Learning - IHK-Zentrum für Weiterbildung GmbH

Dieses fünftägige Intensivseminar vermittelt praxisorientierte Kompetenzen für den Einstieg in Data Science und Machine Learning mit Python. Die Teilnehmenden erlernen die Grundlagen der Programmiersprache Python für die Datenanalyse und entwickeln Schritt für Schritt die Fähigkeit, Machine-Learning-Algorithmen mit scikit-learn eigenständig umzusetzen.

Schwerpunkte der Weiterbildung:
- Python für Data Analytics: Datenstrukturen, eigene Funktionen, Control Flows.
- Datenaufbereitung und Analyse: Arbeiten mit pandas, numpy sowie Visualisierung mit seaborn und matplotlib.
- Machine Learning in der Praxis: Implementierung und Verständnis zentraler Algorithmen (Regression, Klassifikation, Clustering) mit scikit-learn.
- Modellbewertung und Optimierung: Train-Test-Split, Kreuzvalidierung, Hyperparameter-Tuning, Overfitting erkennen und vermeiden.
- Eigenständige Umsetzung: Intensive Übungsphasen und praxisnahe Projekte unter Anleitung des Trainers.

Nach Abschluss des Bootcamps können Sie:
- Daten aus unterschiedlichen Quellen einlesen, bereinigen und visualisieren.
- Machine-Learning-Modelle trainieren, validieren und interpretieren.
- Die Grundlagen von Data Engineering und Data Mining anwenden.
- Ihr Wissen eigenständig weiter ausbauen und in beruflichen Projekten einsetzen.

Besonderheiten:
- Nutzung der Anaconda-Distribution und der IDE Spyder.
- Ideal für Bildungsurlaub und den Einstieg in Data Science, Business Intelligence und Data Analytics.



Termin Ort Preis*
16.03.2026- 20.03.2026 online 3.689,00 €
09.11.2026- 13.11.2026 online 3.689,00 €
*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:
Tag 1: Einführung in Python und Datenstrukturen
- Grundlagen der Programmierung mit Python
- Einführung in die Entwicklungsumgebung
- Syntax und grundlegende Befehle
- Wichtige Datenstrukturen
- Listen, Tupel und Dictionaries
- Arbeiten mit Arrays und Matrizen
- Einführung in pandas
- Der DataFrame als zentrales Datenstruktur-Element
- Datenimport und -export (CSV, Excel)
- Daten einlesen von Datenbanken

Tag 2: Datenmanipulation und -visualisierung
- Datenbereinigung mit pandas
- Umgang mit fehlenden Werten
- Daten filtern und transformieren
- Statistische Analysen
- Berechnung von Mittelwert, Median und Standardabweichung
- Gruppierungen und Kontingenz-Tabellen
- Datenvisualisierung mit matplotlib und seaborn
- Erstellung von Linien-, Balken- und Streudiagrammen
- Anpassung von Diagramm-Layouts und -Stilen

Tag 3: Einführung in Machine Learning
- Numpy und Datenaufbereitung
- Erstellung, Befüllung und Manipulation von numpy-Arrays
- Normalisierung, Umgang mit fehlenden Werten und One-Hot Encoding
- Grundlagen des Machine Learning
- Unterschiede zwischen KI, ML und Deep Learning
- Supervised und Unsupervised Learning sowie Overfitting und Train-Test-Split
- Lineare Regression mit scikit-learn
- Modellerstellung, Datenaufteilung und Validierung in Python
- Analyse der Ergebnisse mit Metriken wie Mean Squared Error

Tag 4: Erweiterte Machine Learning-Methoden
- Logistische Regression und Entscheidungsbaum
- Logistische Regression: Einführung, Modellerstellung und Validierung
- Entscheidungsbaum: Erstellung, Validierung und Hyperparameter-Tuning
- Ensemble-Methoden und AdaBoost
- Einführung in Bagging, Boosting und den AdaBoost-Algorithmus
- Anwendung und Validierung in Python
- Random Forest
- Modellerstellung, Validierung (z. B. Out-of-bag error) und Hyperparameter-Tuning
- Einsatz für Regression und Klassifikation

Tag 5: Praxisworkshop und Projektarbeit
- Weitere Algorithmen
- Einführung in K-Nearest Neighbor und Neuronale Netzwerke (MLP)
- Implementierung und Validierung der Algorithmen
- Optimierung und Modelltraining
- Cross-Validation und Grid Search zur Hyperparameter-Optimierung
- Training des finalen Modells nach der Validierung
- Clustering-Verfahren
- Erstellung und Validierung von K-Means und DBSCAN-Modellen
- Bewertung mit Silhouette Score und Calinski-Harabasz-Index


Voraussetzungen
Unser Data Science Bootcamp benötigt keine Vorkenntnisse in Python. Es ist jedoch notwendig, dass Teilnehmer in einer anderen Programmiersprache Grundkenntnisse besitzen und wissen, was im Programmieren eine Variable ist, was bedeutet, einen Wert einer Variablen zuzuweisen oder was eine Funktion bzw. eine for-Schleife ist.

Basiswissen in Statistik sind für die Data Mining Weiterbildung notwendig, d.h. es sollte bekannt sein, was ein Mittelwert, Median, Normalverteilung oder Standardabweichung ist. Da gelegentlich mathematische Formeln verwendet werden, sollten Symbole der Mathematik, wie das Integral, das Summenzeichen oder Konzepte wie eine Funktion, eine Ableitung oder die Exponentialfunktion bekannt sein. Wir verwenden auch logische Operatoren, so dass Kenntnis der booleschen Algebra mit den Operatoren Nicht-Und-Oder sehr hilfreich sind.

Teilnehmer haben typischerweise bereits mit Daten in einer BI-Software oder in Excel gearbeitet und kennen daher einfache Berechnungen, welche auf Daten ausgeführt werden können (z.B. Spaltensumme ermitteln).

Schulungssprache ist Deutsch. Da die Dokumentation von Python und die Fachbegriffe im Machine Learning meist auf Englisch sind, werden die Folien im Seminar auf Englisch gehalten. Grundlegende Englischkenntnisse beim Lesen von Texten sind daher sehr hilfreich.


Technik im Data Scientist Invensiv Kurs
Für die Übungsaufgaben im Kurs benötigen die Teilnehmer einen Laptop. Es wird empfohlen, Ihren eigenen Laptop zu verwenden, auf dem die erforderliche Software vorab installiert ist. Eine detaillierte Installationsanleitung wird Ihnen vor dem Seminar per E-Mail zugeschickt.
Bitte überprüfen Sie, ob Ihr Firmenlaptop Internetzugriff ohne Einschränkungen hat, da die Seminarunterlagen (Skripte, Code, Dateien) online zum Download bereitgestellt werden.

Hinweis
Das Online-Seminar wird über die E-Learningplattform von Enable AI bereitgestellt. Zur Einrichtung des User-Accounts und Zusendung von Zugangsdaten und Nutzung der Lernplattform übermitteln wir Name, Anschrift, Emailadresse der Teilnehmer an Enable AI. In diesem Zusammenhang wird auch die Telefonnummer zur Klärung der technischen Fragen übermittelt.

Dauer/zeitlicher Ablauf:
40 Stunden
Ziele/Bildungsabschluss:
Teilnahmebescheinigung /
Zielgruppe:
Dieser Python Data Science Intensivkurs richtet sich an Einsteiger, die die Grundlagen von Data Science erlernen möchten. Der Kurs ist ideal für Personen, die mit Python arbeiten wollen, um Daten zu analysieren und Machine Learning Modelle zu erstellen.
Seminarkennung:
1849_261_01AI
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha