Datenanalyse und Machine Learning mit Python - Intensivseminar mit durchgängiger Fallstudie
Webinar - GFU Cyrus AG
Nach dem Seminar sind Sie in der Lage, einen kompletten Analyse- und Machine-Learning-Workflow mit Python strukturiert umzusetzen. Sie können Datensätze mit pandas einlesen, bereinigen, transformieren und explorativ analysieren, aussagekräftige Visualisierungen erstellen sowie Merkmale gezielt für Modellierungsaufgaben aufbereiten.
Darüber hinaus verstehen Sie die Grundlagen des überwachten Machine Learnings und können Klassifikationsmodelle mit scikit-learn trainieren, bewerten und optimieren. Sie beherrschen zentrale Verfahren wie Train-Test-Split, Feature Selection, den Einsatz geeigneter Metriken und Hyperparameter Tuning.
Arbeiten mit einem durchgängigen Datensatz über alle Seminarphasen
Grundlagen mit pandas
Einlesen, Strukturieren und Untersuchen von Daten
Arbeiten mit DataFrames und Series
Filtern, Auswählen, Gruppieren und Aggregieren
Data Cleaning und Datenvorbereitung
Umgang mit fehlenden Werten
Bereinigung inkonsistenter oder fehlerhafter Daten
Datentypen, Umformungen und Vorbereitung für Analyse und Modellierung
Exploratory Data Analysis (EDA)
Statistische Grundauswertung
Erkennen von Verteilungen, Ausreißern und Mustern
Korrelationsanalyse und Untersuchung von Zusammenhängen
Visualisierung von Daten
Erstellung aussagekräftiger Diagramme mit seaborn und plotly
Visual Exploration zur Mustererkennung
Unterstützung der Feature-Entwicklung durch visuelle Analyse
Feature Engineering
Ableitung und Transformation relevanter Merkmale
Nutzung fachlicher und datengetriebener Muster
Vorbereitung geeigneter Features für Klassifikationsmodelle
Grundlagen des überwachten Machine Learnings
Einführung in Supervised Learning
Train-Test-Split und saubere Trennung von Trainings- und Testdaten
Vermeidung typischer Fehler im Modellierungsprozess
Klassifikationsmodelle mit scikit-learn
Überblick über verschiedene Classification Models
Training und Anwendung erster Modelle
Vergleich von Modellverhalten und Ergebnissen
Modellbewertung und Optimierung
Einsatz unterschiedlicher Evaluationsmetriken
Feature Selection
Hyperparameter Tuning zur Verbesserung der Modellleistung
Praxisorientierte Zusammenführung
Aufbau einer vollständigen Pipeline von der Analyse bis zum Modell
Interpretation der Ergebnisse
Übertragung auf eigene Anwendungsfälle aus dem Berufsalltag
Dauer/zeitlicher Ablauf:
5 Tage
Zielgruppe:
Das Seminar richtet sich an Python-Anwender, Data Analysts, angehende Data Scientists, Machine-Learning-Einsteiger, Fachanwender mit analytischem Schwerpunkt sowie Entwickler, die den praktischen Weg von der Datenanalyse bis zur Erstellung erster Machine-Learning-Modelle kennenlernen möchten.
Angesprochen sind insbesondere Personen, die Daten systematisch auswerten, Muster erkennen und datengetriebene Entscheidungen vorbereiten oder Machine-Learning-Verfahren für Klassifikationsaufgaben einsetzen möchten.
Teilnahmevoraussetzungen
Sie benötigen grundlegende Python-Kenntnisse, insbesondere einen sicheren Umgang mit der grundlegenden Syntax.
Erfahrungen mit Datenanalyse, pandas oder Machine Learning sind hilfreich, aber nicht zwingend erforderlich.
Sie verfügen über ein grundlegendes Interesse an Datenanalyse, Statistik und datengetriebenen Fragestellungen.
Das Seminar ist als Intensivseminar für Einsteiger bis leicht Fortgeschrittene konzipiert.
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern.
Diese Cookies werden nicht automatisiert gesetzt.
Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren.
Weitere Informationen finden Sie hier.