Detaillierte Informationen zum Seminar
Inhalte:
Der fünftägige Intensivkurs vermittelt Ihnen umfassende Kenntnisse in Python, Data Science und Machine Learning. Schritt für Schritt lernen Sie, Daten zu analysieren, aufzubereiten und maschinelle Lernmodelle zu erstellen. Der Fokus liegt dabei auf einer ausgewogenen Kombination aus Theorie und praxisnaher Anwendung, um das Gelernte direkt umsetzen zu können.
Tag 1: Einführung in Python und Datenstrukturen
- Grundlagen der Programmierung mit Python
- Einführung in die Entwicklungsumgebung
- Syntax und grundlegende Befehle
- Wichtige Datenstrukturen
- Listen, Tupel und Dictionaries
- Arbeiten mit Arrays und Matrizen
- Einführung in pandas
- Der DataFrame als zentrales Datenstruktur-Element
- Datenimport und -export (CSV, Excel)
- Daten einlesen von Datenbanken
Tag 2: Datenmanipulation und -visualisierung
- Datenbereinigung mit pandas
- Umgang mit fehlenden Werten
- Daten filtern und transformieren
- Statistische Analysen
- Berechnung von Mittelwert, Median und Standardabweichung
- Gruppierungen und Kontingenz-Tabellen
- Datenvisualisierung mit matplotlib und seaborn
- Erstellung von Linien-, Balken- und Streudiagrammen
- Anpassung von Diagramm-Layouts und -Stilen
Tag 3: Einführung in Machine Learning
- Numpy und Datenaufbereitung
- Erstellung, Befüllung und Manipulation von numpy-Arrays
- Normalisierung, Umgang mit fehlenden Werten und One-Hot Encoding
- Grundlagen des Machine Learning
- Unterschiede zwischen KI, ML und Deep Learning
- Supervised und Unsupervised Learning sowie Overfitting und Train-Test-Split
- Lineare Regression mit scikit-learn
- Modellerstellung, Datenaufteilung und Validierung in Python
- Analyse der Ergebnisse mit Metriken wie Mean Squared Error
Tag 4: Erweiterte Machine Learning-Methoden
- Logistische Regression und Entscheidungsbaum
- Logistische Regression: Einführung, Modellerstellung und Validierung
- Entscheidungsbaum: Erstellung, Validierung und Hyperparameter-Tuning
- Ensemble-Methoden und AdaBoost
- Einführung in Bagging, Boosting und den AdaBoost-Algorithmus
- Anwendung und Validierung in Python
- Random Forest
- Modellerstellung, Validierung (z. B. Out-of-bag error) und Hyperparameter-Tuning
- Einsatz für Regression und Klassifikation
Tag 5: Praxisworkshop und Projektarbeit
- Weitere Algorithmen
- Einführung in K-Nearest Neighbor und Neuronale Netzwerke (MLP)
- Implementierung und Validierung der Algorithmen
- Optimierung und Modelltraining
- Cross-Validation und Grid Search zur Hyperparameter-Optimierung
- Training des finalen Modells nach der Validierung
- Clustering-Verfahren
- Erstellung und Validierung von K-Means und DBSCAN-Modellen
- Bewertung mit Silhouette Score und Calinski-Harabasz-Index
Voraussetzungen
Für den Data Scientist Intensivkurs sind keine Vorkenntnisse in Python erforderlich. Allerdings sollten Sie mit einer anderen Programmiersprache vertraut sein, um grundlegende Konzepte wie Variablen, Funktionen und For-Schleifen zu kennen.
Das Seminar umfasst Machine Learning Algorithmen, die auf statistischen Methoden basieren. Daher sind Grundkenntnisse in Statistik notwendig. Begriffe wie Mittelwert, Median, Standardabweichung und Normalverteilung sollten Ihnen geläufig sein. Auch mathematische Symbole wie das Integral und das Summenzeichen sowie Konzepte wie Funktion und Ableitung sind von Vorteil. Logische Operatoren wie UND, ODER und NICHT werden ebenfalls kurz behandelt.
Die Teilnehmer sollten bereits Erfahrung im Umgang mit Daten haben, beispielsweise in Excel oder einer BI-Software, um Konzepte wie spaltenweise Berechnungen und einfache Statistiken (z.B. Mittelwert, Varianz) zu verstehen.
Der Unterricht wird in Deutsch abgehalten, während die Folien auf Englisch sind, da Python, die Dokumentationen der Pakete und viele Fachbegriffe des Machine Learning auf Englisch verfügbar sind. Grundlegende Englischkenntnisse sind daher hilfreich, um den Kursinhalten folgen zu können.
Technik im Data Scientist Invensiv Kurs
Für die Übungsaufgaben im Kurs benötigen die Teilnehmer einen Laptop. Es wird empfohlen, Ihren eigenen Laptop zu verwenden, auf dem die erforderliche Software vorab installiert ist. Eine detaillierte Installationsanleitung wird Ihnen vor dem Seminar per E-Mail zugeschickt.
Bitte überprüfen Sie, ob Ihr Firmenlaptop Internetzugriff ohne Einschränkungen hat, da die Seminarunterlagen (Skripte, Code, Dateien) online zum Download bereitgestellt werden.
Hinweis
Das Online-Seminar wird über die E-Learningplattform von Enable AI bereitgestellt. Zur Einrichtung des User-Accounts und Zusendung von Zugangsdaten und Nutzung der Lernplattform übermitteln wir Name, Anschrift, Emailadresse der Teilnehmer an Enable AI. In diesem Zusammenhang wird auch die Telefonnummer zur Klärung der technischen Fragen übermittelt.
Dauer/zeitlicher Ablauf:
40 Stunden
Ziele/Bildungsabschluss:
Teilnahmebescheinigung /
Zielgruppe:
Dieser Python Data Science Intensivkurs richtet sich an Einsteiger, die die Grundlagen von Data Science erlernen möchten. Der Kurs ist ideal für Personen, die mit Python arbeiten wollen, um Daten zu analysieren und Machine Learning Modelle zu erstellen.
Seminarkennung:
1849_251_02AI