Seminar - Cegos Integrata GmbH
Die Analyse und Verarbeitung großer Datenmengen ist heute ein entscheidender Erfolgsfaktor für datengetriebene Unternehmen. In diesem praxisorientierten Seminar lernen Sie, wie Sie mit Apache Spark und Python (PySpark) effizient Big Data analysieren und aufbereiten. Sie erhalten eine fundierte Einführung in die Grundlagen verteilter Datenverarbeitung, arbeiten mit realitätsnahen Beispielen und wenden moderne Methoden der Datenintegration, Transformation und Aggregation direkt an. Auch die Anwendungsmöglichkeiten von Machine Learning mit PySpark werden thematisiert.
Nach dem Seminar sind Sie in der Lage, große Datenmengen eigenständig zu laden, zu transformieren und gezielt auszuwerten. Sie kennen die Einsatzmöglichkeiten von PySpark im Kontext von Data Science und können fundierte Entscheidungen zur Datenverarbeitung in Big Data Projekten treffen.
| Termin | Ort | Preis* |
|---|---|---|
| 26.03.2026- 27.03.2026 | online | 1.547,00 € |
| 28.05.2026- 29.05.2026 | online | 1.547,00 € |
| 16.07.2026- 17.07.2026 | online | 1.547,00 € |
| 21.09.2026- 22.09.2026 | Frankfurt am Main | 1.547,00 € |
| 21.09.2026- 22.09.2026 | online | 1.547,00 € |
| 16.11.2026- 17.11.2026 | online | 1.547,00 € |
| firmenintern | auf Anfrage | auf Anfrage |
Einführung in Apache Spark Grundlagen:
Erste Schritte in der PySpark-Welt:
Weitere Datentransformationen erkunden:
UDF - User Defined Functions verwenden:
Datenhaltung und Speicherung:
Grundlagen des Maschinellen Lernens:
Vorbereitung der Daten:
Datenexploration:
Modelltraining:
Verfeinerung des Modells: