Seminare
Seminare

Cloud-Datenmanagement für KI: Lakes und Warehouses

Seminar - PROKODA GmbH

Cloud-Datenmanagement für KI: Lakes und Warehouses
Termin Ort Preis*
15.06.2026- 16.06.2026 München 1.725,50 €
15.06.2026- 16.06.2026 online 1.725,50 €
14.09.2026- 15.09.2026 München 1.725,50 €
14.09.2026- 15.09.2026 online 1.725,50 €

Alle Termine anzeigen

*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:
  • KI braucht Daten: Architektur-Entscheidungen
    • Data Lake, Data Warehouse, Lakehouse: Abgrenzung und Einsatz
    • Batch vs. Streaming: wann welche Pipeline sinnvoll ist
    • Compute- und Storage-Entkopplung in der Cloud
    • Typische Anti-Patterns, die KI-Projekte ausbremsen
  • Datenaufnahme und -integration
    • Ingestion-Muster: Landing Zone, Raw, Curated
    • ELT vs. ETL und Auswirkungen auf Qualität und Kosten
    • CDC-Grundlagen und inkrementelle Loads
    • Umgang mit semi-strukturierten Daten (JSON, Logs)
  • Datenmodellierung für Analytics und KI
    • Star Schema, Data Vault: wann es sich lohnt
    • Feature-taugliche Daten: Aggregationen, Zeitbezug, Leakage
    • Dimensionen, Slowly Changing Dimensions (SCD)
    • Semantische Schicht und Self-Service-Analytics
  • Datenqualität, Governance und Sicherheit
    • Data Quality Checks: Vollständigkeit, Plausibilität, Drift
    • Data Catalog, Lineage und Ownership
    • IAM, Rollenmodelle, Row- und Column-Level Security
    • DSGVO-Praxis: Pseudonymisierung, Aufbewahrung, Löschung
  • Formate, Tabellen und Performance
    • Parquet, ORC, JSON: Auswirkungen auf Kosten und Laufzeit
    • Partitionierung, Clustering und Dateigrößen
    • ACID-Tabellen im Lake (z. B. Delta/Apache Iceberg/Hudi)
    • Abfrage-Optimierung und Kostenkontrolle
  • Bereitstellung für KI-Workloads
    • Trainingsdaten-Sets reproduzierbar bereitstellen
    • Feature Store Grundlagen und wann er sinnvoll ist
    • Offline/Online-Serving: Datenpfade für Inferenz
    • Monitoring: Datendrift, Schema-Änderungen, SLAs
Teilnahmevoraussetzungen:
  • Grundverständnis von Datenbanken und SQL ist hilfreich.
  • Erste Berührungspunkte mit Cloud-Services oder Analytics-Projekten sind von Vorteil.
Zielgruppe:
  • Data Engineers und Analytics Engineers
  • Data Architects und Cloud Architects
  • BI-Verantwortliche und Data Product Owner
  • ML Engineers und AI Engineers mit Datenverantwortung
  • Für alle, die Data Lakes und Data Warehouses als Grundlage für KI in der Cloud aufbauen oder verbessern wollen.
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha