Seminare
Seminare

Building Batch Data Analytics Solutions on AWS

Seminar - IT-Schulungen.com

In dieser 1-tägigen Schulung "Building Batch Data Analytics Solutions on AWS" lernen Sie die Erstellung von Batch-Datenanalyselösungen mit Amazon EMR, einem Managed Service für Apache Spark und Apache Hadoop. Sie werden mit Open-Source-Projekten wie Apache Hive, Hue und HBase sowie AWS-Services wie AWS Glue und AWS Lake Formation vertraut gemacht. Der Kurs behandelt die Datensammlung, -aufnahme, -katalogisierung, -speicherung und -verarbeitung im Kontext von Spark und Hadoop. Die Verwendung von EMR Notebooks zur Unterstützung von Analysen und Machine Learning wird ebenfalls behandelt. Dabei liegt ein besonderer Fokus auf Best Practices für Sicherheit, Performance und Kostenmanagement bei der Nutzung von Amazon EMR.


In diesem Kurs lernen Sie die Funktionen und Vorteile von Data Warehouses, Data Lakes und modernen Datenarchitekturen zu vergleichen. Sie werden eine Batch-Datenanalyselösung entwerfen und implementieren und geeignete Techniken zur Optimierung der Datenspeicherung anwenden. Darüber hinaus lernen Sie, die richtigen Optionen zur Aufnahme, Umwandlung und Speicherung von Daten auszuwählen und die für Ihre Anforderungen passenden Instanz- und Node-Typen, Cluster, automatische Skalierung und Netzwerktopologie auszuwählen. Sie werden verstehen, wie Datenspeicherung und -verarbeitung die Analyse- und Visualisierungsmechanismen beeinflussen, um verwertbare Erkenntnisse zu gewinnen. Die Schulung beinhaltet auch das Sichern von Daten im Ru

Termin Ort Preis*
14.10.2024 Nürnberg 946,05 €
14.10.2024 online 946,05 €
*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

Überblick über Data Analytics und die Data Pipeline

  • Einsatzmöglichkeiten der Datenanalyse
  • Verwendung der Data Pipeline für die Datenanalyse


Einführung in Amazon EMR

  • Verwendung von Amazon EMR in Analyselösungen
  • Architektur von Amazon EMR-Clustern
  • Interaktive Demo 1: Starten eines Amazon EMR-Clusters
  • Strategien zur Kostenverwaltung


Datenanalyse-Pipeline mit Amazon EMR: Ingestion und Speicherung

  • Speicheroptimierung mit Amazon EMR
  • Methoden zur Datenübernahme


High-Performance-Batch-Datenanalyse mit Apache Spark auf Amazon EMR

  • Anwendungsbereiche von Apache Spark auf Amazon EMR
  • Warum Apache Spark auf Amazon EMR
  • Spark-Konzepte
  • Transformation, Verarbeitung und Analyse
  • Verwendung von Notebooks mit Amazon EMR
  • Datenanalyse mit niedriger Latenz mit Apache Spark auf Amazon EMR


Verarbeiten und Analysieren von Batch-Daten mit Amazon EMR und Apache Hive

  • Verwendung von Amazon EMR mit Hive zur Verarbeitung von Batch-Daten
  • Transformation, Verarbeitung und Analyse
  • Batch-Datenverarbeitung mit Amazon EMR und Hive
  • Einführung in Apache HBase auf Amazon EMR


Serverlose Datenverarbeitung

  • Serverlose Datenverarbeitung, -transformation und -analytik
  • Verwendung von AWS Glue mit Amazon EMR-Workloads
  • Orchestrierung der Datenverarbeitung in Spark mit AWS Step Functions


Security und Monitoring von Amazon EMR-Clustern

  • Sichern von EMR-Clustern
  • Client-seitige Verschlüsselung mit EMRFS
  • Überwachung und Fehlerbehebung von Amazon EMR-Clustern
  • Überprüfung des Verlaufs von Apache Spark-Clustern


Entwerfen von Batch-Datenanalyselösungen

  • Anwendungsfälle für die Batch-Datenanalytik
  • Entwerfen eines Arbeitsablaufs für die Batch-Datenanalyse


Entwickeln moderner Datenarchitekturen auf AWS

  • Moderne Datenarchitekturen


Ziele/Bildungsabschluss:

In dieser 1-tägigen Schulung "Building Batch Data Analytics Solutions on AWS" lernen Sie die Erstellung von Batch-Datenanalyselösungen mit Amazon EMR, einem Managed Service für Apache Spark und Apache Hadoop. Sie werden mit Open-Source-Projekten wie Apache Hive, Hue und HBase sowie AWS-Services wie AWS Glue und AWS Lake Formation vertraut gemacht. Der Kurs behandelt die Datensammlung, -aufnahme, -katalogisierung, -speicherung und -verarbeitung im Kontext von Spark und Hadoop. Die Verwendung von EMR Notebooks zur Unterstützung von Analysen und Machine Learning wird ebenfalls behandelt. Dabei liegt ein besonderer Fokus auf Best Practices für Sicherheit, Performance und Kostenmanagement bei der Nutzung von Amazon EMR.


In diesem Kurs lernen Sie die Funktionen und Vorteile von Data Warehouses, Data Lakes und modernen Datenarchitekturen zu vergleichen. Sie werden eine Batch-Datenanalyselösung entwerfen und implementieren und geeignete Techniken zur Optimierung der Datenspeicherung anwenden. Darüber hinaus lernen Sie, die richtigen Optionen zur Aufnahme, Umwandlung und Speicherung von Daten auszuwählen und die für Ihre Anforderungen passenden Instanz- und Node-Typen, Cluster, automatische Skalierung und Netzwerktopologie auszuwählen. Sie werden verstehen, wie Datenspeicherung und -verarbeitung die Analyse- und Visualisierungsmechanismen beeinflussen, um verwertbare Erkenntnisse zu gewinnen. Die Schulung beinhaltet auch das Sichern von Daten im Ruhezustand und bei der Übertragung sowie das Monitoring von analytischen Workloads, um Probleme zu identifizieren und zu beheben. Sie lernen außerdem Best Practices für das Kostenmanagement anzuwenden.


Teilnahmevoraussetzungen:

Für eine optimale Teilnahme am Kurs empfehlen wir folgende Vorkenntnisse:


  • Teilnehmer mit mindestens einem Jahr Erfahrung in der Verwaltung von Open-Source Data Frameworks wie Apache Spark oder Apache Hadoop


Lehrgangsverlauf/Methoden:

Die Schulung bietet Ihnen eine ausgewogene Mischung aus Theorie und Praxis in einer erstklassigen Lernumgebung. Profitieren Sie vom direkten Austausch mit unseren projekterfahrenen Trainern und anderen Teilnehmern, um Ihren Lernerfolg zu maximieren.


Zielgruppe:
  • Ingenieure für Datenplattformen
  • Entwickler und Operatoren, die Datenanalyse-Pipelines aufbauen und verwalten


Seminarkennung:
NE-WEBDATE-19d31a2a-8f78-4be3-a34a-149f17ba860f
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha