Seminare
Seminare

Machine Learning mit Python & Scikit Learn

Seminar - Cegos Integrata GmbH

Machine Learning ist ein zentrales Werkzeug moderner Datenanalyse - und gewinnt in nahezu allen Branchen an Bedeutung. In diesem zweitägigen Seminar lernen Sie, wie Sie mit der Programmiersprache Python und der Bibliothek scikit-learn praxisnah Machine-Learning-Modelle entwickeln. Der Fokus liegt auf überwachten Lernverfahren wie linearer und logistischer Regression, Entscheidungsbäumen, Random Forests sowie neuronalen Netzen. Auch Methoden des unüberwachten Lernens wie K-Means und DBSCAN werden behandelt. Sie arbeiten dabei aktiv in JupyterLab und vertiefen Ihr Wissen durch zahlreiche Übungen.

Das Seminar findet wahlweise als Präsenzseminar oder als Live Online Training statt und verbindet theoretische Grundlagen des Machine Learning mit umfangreichen praktischen Übungen in Python.

Nach dem Seminar sind Sie in der Lage, Machine-Learning-Algorithmen selbstständig anzuwenden, Modelle zu bewerten und Ihre Python-Kenntnisse gezielt für datengetriebene Aufgaben einzusetzen. Sie schaffen damit eine fundierte Grundlage für weiterführende Anwendungen im Bereich Data Science.

Dieses Seminar ist Teil dieses Qualifizierungsplaners:

Data Scientist

Termin Ort Preis*
20.04.2026- 21.04.2026 online 1.547,00 €
22.06.2026- 23.06.2026 online 1.547,00 €
20.07.2026- 21.07.2026 online 1.547,00 €
17.09.2026- 18.09.2026 online 1.547,00 €
17.09.2026- 18.09.2026 Düsseldorf 1.547,00 €
14.12.2026- 15.12.2026 online 1.547,00 €
firmenintern auf Anfrage auf Anfrage

Alle Termine anzeigen

*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

Grundlegende Einblicke in das Feld des Maschinellen Lernens:

  • Einführung in das Gebiet des Maschinellen Lernens
  • Erläuterung der Unterschiede zwischen überwachtem und unüberwachtem Lernen
  • Überwindung von Overfitting durch kluge Datasplitting-Strategien (Training vs. Testdaten)

Basiswissen zur Linearen Regression:

  • Verständnis für den Linearen Regressionsalgorithmus aufbauen
  • Richtige Aufteilung von Daten in Training und Test
  • Praktische Umsetzung der Linearen Regression in Python (mit scikit-learn)
  • Solide Überprüfung der Ergebnisse

Eintauchen in die Logistische Regression (unter Nutzung von StatsModels):

  • Aufbau des Verständnisses für die Logistische Regression (Entwicklung von linear zu logistisch)
  • Sorgfältige Datenaufteilung für Training und Test
  • Implementierung der Logistischen Regression in Python
  • Kritische Prüfung und Bewertung der Ergebnisse und des Modells (AIC, BIC, Konfusionsmatrix)
  • Erläuterung der Koeffizienteninterpretation (Odds-Ratio)
  • Roc Curve und Fläche unter der Kurve (AUC) im Fokus

Tiefere Einblicke in den Entscheidungsbaum-Algorithmus:

  • Verständnis für den Entscheidungsbaum-Algorithmus entwickeln
  • Richtige Aufteilung von Daten in Training und Test
  • Konkrete Umsetzung des Entscheidungsbaums in Python (mit scikit-learn)
  • Feintuning der Hyperparameter für optimale Leistung
  • Sorgfältige Validierung der Ergebnisse (Konfusionsmatrix, Genauigkeit)
  • Anwendung des Entscheidungsbaums für Regressionsszenarien

Ensemble-Methoden und ihre Effektivität:

  • Ein Ensemble aus verschiedenen Algorithmen mit scikit-learn realisieren
  • Random Forest für Klassifikation und Regression nutzen
  • Einsatz von Ada Boost für Klassifikation und Regression verstehen
  • Feintuning der Hyperparameter für optimierte Ergebnisse
  • Akkurate Bewertung der Modellleistung durch gezielte Validierung

Erkundung weiterer Schlüsselalgorithmen:

  • K-Nearest Neighbor-Verfahren beleuchten
  • Einfaches Neuronales Netz (Multi-Layer Perceptron, MLP) betrachten
  • Direkte Umsetzung der Algorithmen in Python
  • Gründliche Ergebnisüberprüfung und -bewertung

Optimierung von Hyperparametern und Anwendung von Kreuzvalidierung:

  • Automatisierte Suche nach optimalen Hyperparametern
  • Kreuzvalidierung (Cross-Validation) als Schlüssel zur Modellbewertung
  • Umsetzung dieser Konzepte in scikit-learn

Erkundung von Clustering-Algorithmen:

  • Basisverständnis für K-Means Clustering und DBScan erlangen
  • Interpretation der Ergebnisse von Clustering-Vorgängen
  • Vergleich der Ergebnisse verschiedener Clustering-Methoden
Dauer/zeitlicher Ablauf:
2 Tage
Teilnahmevoraussetzungen:
  • Programmiererfahrung in Python ist erforderlich, insbesondere im Umgang mit pandas DataFrames, Installation und Nutzung von Bibliotheken sowie dem Schreiben eigener Funktionen.
  • Grundkenntnisse in Statistik (z. B. Durchschnitt, Median, Standardabweichung) und mathematischen Symbolen (z. B. Summenzeichen, Integral) sind notwendig.
  • Kenntnisse der booleschen Algebra und logischen Operatoren (UND, ODER, NICHT) werden vorausgesetzt.
  • Englischkenntnisse sind empfehlenswert, da die Programmiersprache und Fachbegriffe häufig auf Englisch sind. Die Schulungsunterlagen sind ebenfalls in Englisch, die Schulung wird hingegen auf Deutsch durchgeführt.
Lehrgangsverlauf/Methoden:
Das Seminar kombiniert kurze theoretische Impulse mit Live-Demonstrationen in Python mit umfangreichen Hands-on-Übungen. Die Teilnehmer:innen arbeiten direkt in JupyterLab und wenden die Methoden auf realitätsnahe Datensätze an. Die Trainer:innen demonstrieren die Vorgehensweise live, begleiten Sie bei der Bearbeitung der Aufgaben und geben Feedback zu Ihren Lösungen.
Zielgruppe:
  • Die Schulung richtet sich an Fachkräfte wie Data Scientists, angehende Machine Learning Engineers, Datenanalystinnen und -analysten, Business Intelligence sowie und Data Analystinnen und Analysten, die ihre Python-Kenntnisse im Bereich Data Science und Data Mining vertiefen möchten.
  • Besonders geeignet für Personen, die bereits über grundlegende Programmierkenntnisse in Python verfügen und diese erweitern wollen, um Machine Learning mit scikit-learn eigenständig umzusetzen.
Seminarkennung:
54500
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha