Detaillierte Informationen zum Seminar
Inhalte:
Grundlagen von Python und Machine Learning
Die Schulung Data Science in Python vermittelt die Grundlagen um Python erfolgreich für Data Science / Data Mining / Datenanalysen anzuwenden und führt in das Thema Machine Learning ein.
Der Schwerpunkt des Seminars liegt in der praktischen Umsetzung der Algorithmen in der Programmiersprache Python. Auf anschauliche und intuitive Weise wird das benötigte theoretische Wissen vermittelt, ohne sich in langatmige wissenschaftliche Diskurse zu verlieren. Unser Ziel ist es Sie schnell zu befähigen, eigenständig erste Daten Analysen durchzuführen und Algorithmen des Maschinellen Lernens für die Datenanalyse anwenden zu können.
Der Code wird in der - für Anfänger leicht zugänglichen - Entwicklungsumgebung (IDE) Spyder geschrieben.
Der Fokus des Seminars ist das Python Paket pandas. Diese Paket wurde speziell für Data Science Anwendungen geschrieben. Zur Visualisierung und Erstellung von Grafiken werden die Pakete seaborn und matplotlib eingeführt.
Ab dem Ende des zweiten Tages behandeln wir das Thema Maschinelles Lernen, stellen die Grundlagen vor und erläutern einige wichtige Algorithmen. Die Umsetzung erfolgt mit dem Python Paket scikit-learn.
Das selbständige Bearbeiten von Coding Aufgaben ist ein zentraler Bestandteil der Schulung. Damit können Sie das Erlernte sofort in die Praxis umsetzen.
Behandelte Themen in dieser Schulung:
* Grundlagen von Python
* Grundlegende Datenstrukturen (list, dictionary, tuple, string)
* Das Python Paket pandas
* pandas data.frame
* Berechnen von Statistiken direkt im pandas Data.Frame
* Control Flows (for loop, if-else, while, Funktionen)
* Datenvisualisierung mit seaborn / matplotlib
* Daten einlesen und schreiben
* Überblick über Machine Learning
* Lineare Regression (mit scikit-learn)
* Entscheidungsbaum (mit scikit-learn)
* K-Means Clustering
* Cross-validation (Kreuzvalidierung)
* Überblick über weitere Machine Learning Algorithmen: Support Vector Machine
Ziele/Bildungsabschluss:
In diesem Seminar erlernen Sie die Programiersprache Python für Anwendungen im Bereich Data Science / Data Mining (unter Verwendung von Machine Learning Algorithmen). Sie erlernen die Python Pakete pandas, scikit-learn und seaborn/matplotlib. Das Seminar ist sehr praxisorientiert mit vielen Übungsaufgaben (inkl. Musterlösungen), welche die Kursteilnehmer eigenständig in der Entwicklungsumgebung Spyder bearbeiten. Der Kursleiter steht dabei natürlich jederzeit für Fragen zur Verfügung.
Teilnahmevoraussetzungen:
Python Kenntnisse werden nicht vorausgesetzt. Notwendig ist jedoch grundlegende Konzepte einer anderen Programmiersprache zu verstehen, so dass Stichworte wie Variable, Funktion, Zuweisung von Werten zu einer Variablen, for-Schleife bekannt sind. Grundlegende Vorkenntnisse in der Statistik sind notwendig (d.h. Begriffsdefinitionen wie z.B. Normalverteilung, Median, Mittelwert, Standardabweichung). Zudem Kenntnisse der grundlegenden mathematischen Symbole und Begriffe (z.B. Exponentialfunktion, Integral, Ableitung, Summenzeichen). Kenntnisse im Lesen der Englischen Sprache sind hilfreich.
Förderung:
Bildungscheck NRW
Zielgruppe:
Die Python Schulung richtet sich an Data Analysts, angehende Machine Learning engineers, data scientists, Busines Intelligence Analysts, Datenanalysten, o.ä. welche die Programmiersprache Python für Datenanalysen und Data Mining / Data Science Projekte einsetzen möchten und auch Machine Learning Algorithmen kennen lernen möchten.
Seminarkennung:
17