Seminare
Seminare

Big Data II - Praxis-Vertiefung

Seminar - Cegos Integrata GmbH

Dieses Big Data Training zeigt Ihnen, wie moderne Datenplattformen praktisch aufgebaut, erweitert und betrieben werden. Im Mittelpunkt steht die Umsetzung realer Datenpipelines: Sie laden Daten aus verschiedenen Quellen, transformieren und modellieren diese strukturiert und lernen, wie Daten zuverlässig, skalierbar und nachvollziehbar bereitgestellt werden.
In dieser Data Engineering Schulung arbeiten Sie mit aktuellen Werkzeugen wie dlt, dbt, DuckDB, Apache Spark und Apache Kafka. Sie lernen, wie moderne ELT-Workflows entstehen, wie Datenqualität sichergestellt wird und wie sich Batch- und Streaming-Prozesse in einer produktionsnahen Umgebung verbinden lassen.
Das Seminar legt den Fokus auf praktische Handlungsfähigkeit. Sie arbeiten mit realistischen Musterdaten, entwickeln End-to-End-Datenpipelines und erhalten Vorlagen, Patterns und Best Practices, die Sie auf eigene Projekte übertragen können.

Ihre Vorteile / Nutzen
Für Teilnehmende:
Sie können moderne Datenpipelines eigenständig planen, entwickeln, testen und stabil betreiben. Sie gewinnen Sicherheit im Umgang mit wichtigen Data-Engineering-Tools und verstehen, wie Spark, Kafka, dbt, DuckDB und dlt in realen Datenplattformen zusammenspielen.

Für Unternehmen:
Unternehmen profitieren von skalierbaren, wartbaren und effizient betriebenen Datenprozessen. Dadurch entsteht eine verlässliche Grundlage für Analytics, Reporting, KI-Anw...

Termin Ort Preis*
08.10.2026- 09.10.2026 online 1.892,10 €
10.12.2026- 11.12.2026 online 1.892,10 €
firmenintern auf Anfrage auf Anfrage
*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

Modul 1: Architektur & Modern Data Stack

  • ELT vs. ETL: Paradigmen, die heute zählen
  • Überblick über dlt, dbt, DuckDB, Spark & Kafka
  • Rolle von Storage, Compute und Metadaten

Modul 2: Daten laden & vorbereiten (Ingestion & Staging)

  • Quellen: APIs, Datenbanken, Flat Files
  • Einsatz von dlt zur Datenaufnahme
  • Versionierung & Change Tracking

Modul 3: Datenmodellierung & Transformation mit dbt

  • Lakehouse & Medallion Modellierung
  • Datenqualität, Tests & Dokumentation
  • Best Practices für Wiederverwendungsfähigkeit

Modul 4: Datenanalyse & Exploration mit DuckDB

  • Lokale Query Engines effizient nutzen
  • Performancevorteile gegenüber klassischen Tools
  • Analysepipeline entwickeln

Modul 5: Skalierung & Betrieb

  • Batch-Verarbeitung mit Apache Spark
  • Streaming mit Apache Kafka
  • Performance, Monitoring & Kostenoptimierung

Modul 6: Stabiler Betrieb & Takeaways

  • Pipeline-Orchestrierung und Deployment
  • Logging, Alerting & Fehlermanagement
  • Best Practices & Transfer in den eigenen Kontext
Dauer/zeitlicher Ablauf:
2 Tage
Teilnahmevoraussetzungen:
Grundlagenwissen zu Big-Data-Architekturen und Datenkonzepten wird vorausgesetzt, zum Beispiel durch die Teilnahme an 54601 - Big Data I - Grundlagen.
Basiskenntnisse in SQL sind hilfreich. Erste Erfahrung mit Python oder einer anderen Programmiersprache ist von Vorteil, aber nicht zwingend erforderlich.
Lehrgangsverlauf/Methoden:
Das Seminar kombiniert Hands-on Labs, Live Coding, Mini-Projekte, technische Impulse, Diskussion realer Anwendungsfälle sowie Best Practices und Troubleshooting-Sessions.

Der Fokus liegt klar auf praktischer Umsetzung: Die Teilnehmenden arbeiten mit vorbereiteten Übungen, realitätsnahen Daten und nachvollziehbaren Patterns. Dadurch entsteht eine direkte Verbindung zwischen Schulungsinhalten und typischen Anforderungen aus Data-Engineering-Projekten.
Zielgruppe:
Das Seminar richtet sich an Data Engineers, Data Scientists, Softwareentwickler:innen, Analytics Engineers sowie technisch affine Anwender:innen, die bereits Grundlagen im Big-Data-Umfeld besitzen und nun praxisorientierte Umsetzungskompetenz aufbauen möchten.

Besonders geeignet ist das Training für Teams, die Datenpipeline-Prozesse professionalisieren, Data-Engineering-Kompetenz aufbauen oder moderne Tools wie Spark, Kafka, dbt und DuckDB in der Praxis kennenlernen möchten.
Seminarkennung:
54602
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha