Detaillierte Informationen zum Seminar
Inhalte:
Python für Data Science und Machine Learning
In diesem 5-tägigem Intensivseminar lernen Sie wie Sie Python für Data Science / Data Mining Projekte anwenden können, auch unter Hinzunahme von Machine Learning Algorithmen. Python Kenntnisse werden nicht vorausgesetzt, Vorerfahrung in einer anderen Programmiersprache sind aber notwendig.
Am Ende des Seminars haben Sie ein theoretische Verständnis für Data Sciene und Machine Learning Verfahren und können Data Science Analysen mit dem Python Paket pandas erstellen und Machine Learning Algorithmen (mit dem Paket scikit-learn) auf ihren Daten trainieren und die Ergebnisse evaluieren. Plots und Grafiken werden mit den Python Paketen seaborn und matploblib erstellt.
Die verwendete Entwicklungsumgebung / IDE ist Spyder.
Dieser Kurs ist sehr praxisorientiert, d.h. die Teilnehmer bearbeiten in jedem Themenblock Übungsaufgaben (Musterlösungen vorhanden), in denen Sie Code schreiben dürfen. Dadurch wird das theoretische Wissen gleich in die Praxis umgesetzt.
Behandelte Themen in diesem Seminar:
* Grundlagen von Python
* Grundlegende Datenstrukturen in Python
* Das Paket pandas – Data.Frame
* Berechnen von Statistiken direkt im pandas Data.Frame
* Datenvisualisierung mit seaborn / matplotlib
* Daten einlesen und schreiben
* Datenbank (Python Paket SQLAlchemy)
* Python Paket Numpy (für numerische Berechnungen)
* Datenaufbereitung
* Überblick über Machine Learning
* Lineare Regression mit scikit-learn
* Logistische Regression mit statsmodels
* Entscheidungsbaum mit scikit-learn
* Ensembles (+ Ada-Boost)
* Random Forest
* weitere Machine Learning Algorithmen: K-nearest Neighbor, Einfaches Neuronales Netzwerk
* Grid Search & Cross Validation
* Clustering (K-Means, DBSCAN)
* Fallbeispiel zum Wiederholen
Ziele/Bildungsabschluss:
Dieser Kurs verfolgt das Ziel, Ihnen das notwendige theoretische Wissen über Data Science und Machine Learning zu vermitteln und zu zeigen, wie Sie die Datenanalysen und Algorithmen in Python umsetzen können. Der Fokus liegt dabei in der praktischen Umsetzung in Python.
Teilnahmevoraussetzungen:
Python Kenntnisse werden nicht vorausgesetzt. Notwendig ist jedoch grundlegende Konzepte einer anderen Programmiersprache zu verstehen, so dass Stichworte wie Variable, Funktion, Zuweisung von Werten zu einer Variablen, for-Schleife bekannt sind. Grundlegende Vorkenntnisse in der Statistik sind notwendig (d.h. Begriffsdefinitionen wie z.B. Normalverteilung, Median, Mittelwert, Standardabweichung). Zudem Kenntnisse der grundlegenden mathematischen Symbole und Begriffe (z.B. Exponentialfunktion, Integral, Ableitung, Summenzeichen). Kenntnisse im Lesen der Englischen Sprache sind hilfreich.
Förderung:
Bildungscheck NRW
Zielgruppe:
Die Python Schulung richtet sich an Data Analysts, angehende Machine Learning engineers, data scientists, Busines Intelligence Analysts, Datenanalysten, o.ä. welche die Programmiersprache Python für Datenanalysen und Data Mining / Data Science Projekte einsetzen möchten und auch Machine Learning Algorithmen kennen lernen möchten.
Seminarkennung:
20