Detaillierte Informationen zum Seminar
Inhalte:
Tag 1: Einführung in Python und Datenstrukturen
- Grundlagen der Programmierung mit Python
- Einführung in die Entwicklungsumgebung
- Syntax und grundlegende Befehle
- Wichtige Datenstrukturen
- Listen, Tupel und Dictionaries
- Arbeiten mit Arrays und Matrizen
- Einführung in pandas
- Der DataFrame als zentrales Datenstruktur-Element
- Datenimport und -export (CSV, Excel)
- Daten einlesen von Datenbanken
Tag 2: Datenmanipulation und -visualisierung
- Datenbereinigung mit pandas
- Umgang mit fehlenden Werten
- Daten filtern und transformieren
- Statistische Analysen
- Berechnung von Mittelwert, Median und Standardabweichung
- Gruppierungen und Kontingenz-Tabellen
- Datenvisualisierung mit matplotlib und seaborn
- Erstellung von Linien-, Balken- und Streudiagrammen
- Anpassung von Diagramm-Layouts und -Stilen
Tag 3: Einführung in Machine Learning
- Numpy und Datenaufbereitung
- Erstellung, Befüllung und Manipulation von numpy-Arrays
- Normalisierung, Umgang mit fehlenden Werten und One-Hot Encoding
- Grundlagen des Machine Learning
- Unterschiede zwischen KI, ML und Deep Learning
- Supervised und Unsupervised Learning sowie Overfitting und Train-Test-Split
- Lineare Regression mit scikit-learn
- Modellerstellung, Datenaufteilung und Validierung in Python
- Analyse der Ergebnisse mit Metriken wie Mean Squared Error
Tag 4: Erweiterte Machine Learning-Methoden
- Logistische Regression und Entscheidungsbaum
- Logistische Regression: Einführung, Modellerstellung und Validierung
- Entscheidungsbaum: Erstellung, Validierung und Hyperparameter-Tuning
- Ensemble-Methoden und AdaBoost
- Einführung in Bagging, Boosting und den AdaBoost-Algorithmus
- Anwendung und Validierung in Python
- Random Forest
- Modellerstellung, Validierung (z. B. Out-of-bag error) und Hyperparameter-Tuning
- Einsatz für Regression und Klassifikation
Tag 5: Praxisworkshop und Projektarbeit
- Weitere Algorithmen
- Einführung in K-Nearest Neighbor und Neuronale Netzwerke (MLP)
- Implementierung und Validierung der Algorithmen
- Optimierung und Modelltraining
- Cross-Validation und Grid Search zur Hyperparameter-Optimierung
- Training des finalen Modells nach der Validierung
- Clustering-Verfahren
- Erstellung und Validierung von K-Means und DBSCAN-Modellen
- Bewertung mit Silhouette Score und Calinski-Harabasz-Index
Voraussetzungen
Unser Data Science Bootcamp benötigt keine Vorkenntnisse in Python. Es ist jedoch notwendig, dass Teilnehmer in einer anderen Programmiersprache Grundkenntnisse besitzen und wissen, was im Programmieren eine Variable ist, was bedeutet, einen Wert einer Variablen zuzuweisen oder was eine Funktion bzw. eine for-Schleife ist.
Basiswissen in Statistik sind für die Data Mining Weiterbildung notwendig, d.h. es sollte bekannt sein, was ein Mittelwert, Median, Normalverteilung oder Standardabweichung ist. Da gelegentlich mathematische Formeln verwendet werden, sollten Symbole der Mathematik, wie das Integral, das Summenzeichen oder Konzepte wie eine Funktion, eine Ableitung oder die Exponentialfunktion bekannt sein. Wir verwenden auch logische Operatoren, so dass Kenntnis der booleschen Algebra mit den Operatoren Nicht-Und-Oder sehr hilfreich sind.
Teilnehmer haben typischerweise bereits mit Daten in einer BI-Software oder in Excel gearbeitet und kennen daher einfache Berechnungen, welche auf Daten ausgeführt werden können (z.B. Spaltensumme ermitteln).
Schulungssprache ist Deutsch. Da die Dokumentation von Python und die Fachbegriffe im Machine Learning meist auf Englisch sind, werden die Folien im Seminar auf Englisch gehalten. Grundlegende Englischkenntnisse beim Lesen von Texten sind daher sehr hilfreich.
Technik im Data Scientist Invensiv Kurs
Für die Übungsaufgaben im Kurs benötigen die Teilnehmer einen Laptop. Es wird empfohlen, Ihren eigenen Laptop zu verwenden, auf dem die erforderliche Software vorab installiert ist. Eine detaillierte Installationsanleitung wird Ihnen vor dem Seminar per E-Mail zugeschickt.
Bitte überprüfen Sie, ob Ihr Firmenlaptop Internetzugriff ohne Einschränkungen hat, da die Seminarunterlagen (Skripte, Code, Dateien) online zum Download bereitgestellt werden.
Hinweis
Das Online-Seminar wird über die E-Learningplattform von Enable AI bereitgestellt. Zur Einrichtung des User-Accounts und Zusendung von Zugangsdaten und Nutzung der Lernplattform übermitteln wir Name, Anschrift, Emailadresse der Teilnehmer an Enable AI. In diesem Zusammenhang wird auch die Telefonnummer zur Klärung der technischen Fragen übermittelt.
Dauer/zeitlicher Ablauf:
40 Stunden
Ziele/Bildungsabschluss:
Teilnahmebescheinigung /
Zielgruppe:
Dieser Python Data Science Intensivkurs richtet sich an Einsteiger, die die Grundlagen von Data Science erlernen möchten. Der Kurs ist ideal für Personen, die mit Python arbeiten wollen, um Daten zu analysieren und Machine Learning Modelle zu erstellen.
Seminarkennung:
1849_261_01AI