Seminare
Seminare

Live-Online: Data Warehousing on AWS

Webinar - Haufe Akademie GmbH & Co. KG

In diesem Kurs lernst du, wie du mit Amazon Redshift eine Cloud-basierte Data-Warehousing-Lösung entwickelst.
Termin Ort Preis*
20.05.2024- 22.05.2024 online 2.332,40 €
08.07.2024- 10.07.2024 online 2.332,40 €
*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

Dieser Kurs führt dich ein in die Konzepte, Strategien und bewährten Methoden für die Konzeptionierung einer Cloud-basierten Data Warehousing-Lösung mit Amazon Redshift, dem Data Warehouse in AWS in Petabyte-Größe. Es wird demonstriert, wie Daten für das Data Warehouse mithilfe anderer AWS-Services wie Amazon DynamoDB, Amazon EMR, Amazon Kinesis Firehose und Amazon Simple Storage Service (Amazon S3) gesammelt, gespeichert und vorbereitet werden. Wir werden außerdem erläutern, wie du Business-Intelligence-(BI)-Tools zur Analyse deiner Daten einsetzen kannst.


Dieser Kurs ist zusätzlich mit Inhalten des Kurses Building Data Analytics Solutions using Amazon Redshift angereichert


 


Modul 1: Einführung in Data Warehousing


  • Relationale Datenbanken
  • Data-Warehousing-Konzepte
  • Die Überschneidung von Data Warehousing und Big Data
  • Überblick über die Datenverwaltung in AWS
  • Praktisches Lab 1: Einführung in Amazon Redshift


 


Modul 2: Einführung in Amazon Redshift


  • Konzeptueller Überblick
  • Anwendungsfälle aus der Praxis
  • Interaktive Demo 1: Rundgang durch die Amazon-Redshift-Konsole
  • Praktisches Lab 2: Starten eines Amazon-Redshift-Clusters
  • RA3 Nodes and AQUA-Architektur
  • Amazon Redshift ML


 


Modul 3: Starten von Clustern


  • Aufbau des Clusters
  • Verbinden mit dem Cluster
  • Kontrolle des Zugriffs
  • Sicherheit der Datenbank
  • Daten laden
  • Praktisches Lab 3: Optimieren von Datenbank-Schemata
  • Optionales Lab: Starten eines Amazon-Redshift-Cluster


 


Modul 4: Entwerfen des Datenbankschemas


  • Schemas und Datentypen
  • Spaltenweise Komprimierung
  • Stile der Datenverteilung
  • Methoden zur Datensortierung
  • Praktisches Lab 3: Optimieren von Datenbank-Schemas


 


Modul 5: Identifizierung von Datenquellen


  • Überblick über Datenquellen
  • Amazon S3
  • Amazon DynamoDB
  • Amazon EMR
  • Amazon Kinesis Daten-Firehose
  • AWS-Lambda-Datenbanklader für Amazon Redshift
  • Redshift Data API
  • SUPER Data Type
  • Interaktive Demo 2: Verbinden deines Amazon-Redshift-Clusters mit einem Jupyter-Notebook mit Data API
  • Interaktive Demo 3: Analyse halbstrukturierter Daten mit dem Datentyp SUPER
  • Praktisches Lab 4: Laden von Echtzeitdaten in eine Amazon-Redshift-Datenbank


 


Modul 6: Laden von Daten


  • Vorbereiten von Daten
  • Data Warehousing auf AWS
  • Laden von Daten mit COPY
  • Pflegen von Tabellen
  • Gleichzeitige Schreibvorgänge
  • Fehlersuche bei Ladeproblemen
  • Praktische Übung 5: Laden von Daten mit dem COPY-Befehl


 


Modul 7: Schreiben von Abfragen und Leistungs-Tuning


  • Amazon Redshift SQL
  • Benutzerdefinierte Funktionen (UDFs)
  • Faktoren, die die Abfrageleistung beeinflussen
  • Der EXPLAIN-Befehl und Abfragepläne
  • Arbeitslast-Verwaltung (WLM)
  • Interaktive Demo 4: Applying mixed workload management on Amazon Redshift
  • Praktisches Lab 6: Konfigurieren der Arbeitslastverwaltung


 


Modul 8: Amazon Redshift Spectrum


  • Amazon Redshift Spectrum
  • Konfigurieren von Daten für Amazon Redshift Spectrum
  • Amazon-Redshift-Spectrum-Abfragen
  • Daten-Transformation
  • Daten-Sharing
  • Übungs-Lab 2: Datenanalyse mit Amazon Redshift Spectrum
  • Übungs-Lab 3: Datentransformation und -abfrage in Amazon Redshift
  • Praktisches Lab 7: Verwendung von Amazon Redshift Spectrum


 


Modul 9: Wartung von Clustern


  • Audit-Protokollierung
  • Leistungsüberwachung
  • Ereignisse und Benachrichtigungen
  • Praktische Übungen 8: Auditing und Überwachung von Clustern
  • Größenänderung von Clustern
  • Sichern und Wiederherstellen von Clustern
  • Ressourcenkennzeichnung und Grenzen und Beschränkungen
  • Praktisches Lab 9: Sichern, Wiederherstellen und Größenänderung von Clustern
  • Optional: Daten-Analyse und -Visualisierung


 


Modul 10: Analysieren und Visualisieren von Daten


  • Leistung von Visualisierungen
  • Erstellen von Dashboards
  • Amazon-QuickSight-Editionen und -Funktionen
Dauer/zeitlicher Ablauf:
3 Tage
Ziele/Bildungsabschluss:
  • Evaluation der Beziehung zwischen Amazon Redshift und anderen Big-Data-Systemen
  • Fallbeispiele für Arbeitslasten von Data Warehouses evaluieren und von Fallstudien behandeln, die die Implementierung der AWS Daten- und Analyseservices als Teil der Data Warehousing-Lösung demonstrieren
  • Einen Amazon Redshift-Knotentyp in der für deine Datenbedürfnisse geeigneten Größe auswählen
  • Für Amazon Redshift geeignete Sicherheitsfunktionen verstehen, wie z.B. Verschlüsselung, IAM-Berechtigungen und Datenbankberechtigungen
  • Einen Amazon Redshift-Cluster in Betrieb nehmen und Komponenten und Funktionen zur Implementierung eines Data Warehouses in der Cloud nutzen
  • Weitere AWS- und Analyse-Services wie Amazon DynamoDB, Amazon EMR, Amazon Kinesis Firehose und Amazon S3 als Beitrag zur Data-Warehousing-Lösung verwenden
  • Ansätze und Methoden zur Konzeptionierung von Data Warehouses evaluieren
  • Datenquellen bestimmen und Anforderungen evaluieren, die sich auf das Data-Warehouse-Konzept auswirken
  • Data Warehouse im Hinblick auf die effektive Nutzung von Komprimierung, Datenverteilung und Sortiermethoden entwerfen
  • Daten laden und entladen sowie Aufgaben der Datenwartung durchführen
  • Abfragen verfassen und Abfragepläne zur Optimierung der Abfrageleistung auswerten
  • Die Datenbank zur Ressourcenzuweisung konfigurieren, etwa des Speichers für Abfrage-Queues, und die Kriterien definieren, um deinen konfigurierten Abfrage-Queues für eine bessere Verarbeitung bestimmte Abfragetypen zuzuweisen
  • Ereignisbenachrichtigungen über Aktivitäten im Data Warehouse mithilfe von Funktionen und Services, wie Amazon Redshift Database Audit Logging, Amazon CloudTrail, Amazon CloudWatch und Amazon Simple Notification Service (Amazon SNS), überprüfen, überwachen und empfangen
  • Betriebsaufgaben vorbereiten, etwa Größenänderung des Amazon Redshift-Clusters und Verwendung von Snapshots für das Backup und die Wiederherstellung von Clustern
  • Eine BI-Anwendung zur Durchführung von Datenanalysen und Visualisierungsaufgaben anhand deiner Daten verwenden
Zielgruppe:

Dieser Kurs richtet sich an folgende Jobrollen:


  • Data Analytics


 


Wir empfehlen, dass die Teilnehmer:innen an diesem Kurs die folgenden Voraussetzungen mitbringen:


Vertrautheit mit relationalen Datenbanken und Datenbankdesign-Konzepten

Seminarkennung:
36407
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha