Seminare
Seminare

Data Scientist mit Python: Data Pipelines mit Machine-Learning-Algorithmen und Python – das Online-Training mit Abschlusszertifikat

Webinar - Haufe Akademie GmbH & Co. KG

Daten automatisiert und in Echtzeit verarbeiten, analysieren und daraus Erkenntnisse ableiten zu können, gehört zu den zentralen Anforderungen von Unternehmen. Die Daten-Pipelines dafür aufzubauen, ist die Aufgabe von Data Scientists – ein Berufsfeld, das derzeit besonders gefragt ist und große Chancen bietet. Diese zertifizierte Online-Weiterbildung befähigt dich, Data-Mining-Prozesse aufzusetzen, Machine-Learning-Algorithmen anzuwenden, Prognosemodelle zu erstellen und diese in automatisierten Workflows produktiv zu setzen. Dabei wird die Programmiersprache Python mit ihren führenden Machine-Learning-Bibliotheken verwendet. Dieser Online-Kurs ist so konzipiert, dass du flexibel und in deinem eigenen Tempo lernen kannst. Es erwarten dich Videos, interaktive Grafiken, Texte und viele praktische Übungen mit umfangreichen Datensätzen und Coding-Aufgaben. Bei Fragen stehen dir erfahrene Datenanalyst:innen als Mentor:innen zur Seite.
Termin Ort Preis*
20.10.2025- 19.04.2026 online 5.355,00 €
01.12.2025- 31.05.2026 online 5.355,00 €
*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

1. Grundlagen Data Analytics mit Python


  • Arbeiten mit dem Data Lab.
  • Grundlagen und Konzepte in Python.
  • Vorstellung der Tools pandas, matplotlib und seaborn.
  • Datenbankanfragen mit SQL Alchemy.


2. Lineare Algebra


  • Mathematische Hintergründe.
  • Grundbegriffe der linearen Algebra.
  • Berechnung mit Vektoren und Matrizen.
  • Einsatz der Python-Bibliothek numpy.


3. Wahrscheinlichkeitsverteilung


  • Statistik in Data-Science-Algorithmen.
  • Diskrete und kontinuierliche Verteilungen.
  • Versionierung von Code in Git.


4. Überwachtes Lernen (Regression)


  • Lineare Regression einsetzen.
  • Einsatz des Python-Pakets sklearn.
  • Regressionsmodelle verstehen.
  • Evaluation der Prognosen.
  • Bias-Variance-Trade-Off und Regularisierung.
  • Messung der Modellgüte.


5. Überwachtes Lernen (Klassifikation)


  • Konzepte des Supervised Learning.
  • Einführung in Klassifikationsalgorithmen.
  • Der k-Nearest-Neighbors-Algorithmus.
  • Einschätzung der Klassifikationsperformance.
  • Optimierung der Parameter.
  • Aufteilung der Daten in Trainings- und Evaluationssets.


6. Unüberwachtes Lernen (Clustering)


  • Konzepte des Unsupervised Learning.
  • Der k-Means-Algorithmus.
  • Evaluation der Performance-Metriken.
  • Alternativen zum k-Means-Clustering.


7. Unüberwachtes Lernen (Dimensionsreduktion)


  • Dimensionen in der Datenbetrachtung reduzieren.
  • Principal Component Analysis (PCA).
  • Unkorrelierte Features aus Ursprungsdaten erzeugen.
  • Einführung in Feature Engineering.


8. Ausreißer identifizieren und ausschließen


  • Methoden zur Erkennung von Ausreißern.
  • Kriterien ungewöhnlicher Datenpunkte.
  • Robuste Maße und Reduktion der Einflüsse durch Ausreißer.


9. Daten sammeln und zusammenführen


  • Daten aus Webseiten und PDF-Dokumenten auslesen.
  • Einsatz von Regulären Ausdrücken.
  • Textdaten vor der Verarbeitung strukturieren.


10. Logistische Regression


  • Konzepte der logistischen Regression.
  • Performance-Metriken zur Evaluation.
  • Nicht-numerische Daten in Modellen einsetzen.


11. Entscheidungsbäume und Random Forests


  • Das Konzept der Decision Trees.
  • Mehrere Modelle zu Ensembles kombinieren.
  • Methoden zur Verbesserung der Vorhersagequalität.


12. Support Vector Machines


  • Einsatz von Support Vector Machines (SVM).
  • Einführung in Natural Language Processing (NLP).
  • Textklassifikation mit Bag-of-Words-Modellen.


13. Neuronale Netze


  • Grundlagen Künstlicher Neuronaler Netze (KNN).
  • Grundlagen des Deep Learnings.
  • Tieferes Verständnis der Schichten in KNN.


14. Visualisierung und Model Interpretation


  • Funktionsweisen von Modellen ableiten und darstellen.
  • Methoden zur Interpretation und Visualisierung.
  • Modellagnostische Methoden anwenden.


15. Verteilte Datenbanken einsetzen


  • Das Python-Paket PySpark einsetzen.
  • Daten aus verteilten Datenbanken auslesen.
  • Grundlagen von Big-Data-Analysen.
  • Machine-Learning-Algorithmen in verteilten Systemen nutzen.


16. Übungsprojekt


  • Umfassendes Übungsprojekt selbstständig bearbeiten.
  • Prädiktionsproblem mithilfe eines größeren Datensets lösen.
  • Vorbereitung für das Abschlussprojekt.


17. Abschlussprojekt


  • Selbstständige Analyse des Datenprojekts.
  • Ergebnispräsentation und 1:1-Feedbackgespräch mit Mentor:innen-Team.
  • Erhalt des Zertifikats zum Data Scientist mit Python.
Dauer/zeitlicher Ablauf:
18 Wochen (6 Std./Woche)
Ziele/Bildungsabschluss:

In diesem praxisorientierten Training lernst du, selbstständig Datenanalysen mit großen Datensetsdurchzuführen.


Du lernst kompetent mit Pythonumzugehen, die Programmiersprache zur Datenauswertung einzusetzen und effektive Visualisierungen zu erstellen.


Du erfährst, wie du verschiedenste Datenquellen anbinden, Daten darin filtern und daraus zusammenführen kannst.


Du lernst umfassend Methoden, Algorithmen und Technologien des Machine Learnings kennen und erfährst, wie du diese mit Python-Paketen einsetzen kannst.


Du erfährst alles Wichtige über den Einsatz von Deep Learning und erzeugst ein künstliches neuronales Netzmit mehreren Schichten.


Nach dem Training bist du in der Lage Unternehmensdaten zu untersuchen, aussagekräftig zu visualisieren und in dynamischen Dashboards interaktiv zugänglich zu machen.


Die technischen Einstiegshürden werden durch den Einsatz von Jupyter Notebooksminimiert, mit denen du die Programmierübungen direkt im Browser durchführen kannst.

Zielgruppe:

alle, die eine umfassende Schulung über Machine Learning und Data Pipelines suchen. Es werden Grundkenntnisse in Python vorausgesetzt. Die Weiterbildung eignet sich auch für Quereinsteiger:innen.

Seminarkennung:
30354
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha