Seminare
Seminare

Data Science Crash Course mit R (Online)

Webinar - DHL Data Science Seminare GmbH

In dem Kurs Data Science Crash Course mit R erhalten Sie eine modular aufgebaute Einführung in die Themen Data Science, Künstliche Intelligenz und Machine Learning (Maschinelles Lernen) sowohl für numerische als auch für Textdaten (ChatGPT wird behandelt). Bei Vorkenntnissen können Sie die Module einzeln besuchen.

 

Im Modul Künstliche Intelligenz mit R erhalten Sie einen Überblick über das Thema Künstliche Intelligenz mit vielen Praxisbeispielen. Zudem werden Sie in R so weit fit gemacht, dass Sie Ihr erstes Data-Science-Projekt vom Einlesen der Daten bis hin zur Speicherung der Modelle zur weiteren Verwendung eigenhändig umsetzen können.

 

Das Modul Machine Learning mit R geht nun einen Schritt weiter. Hier erhalten Sie einen Einblick in die unterschiedlichen Algorithmen des Maschinellen Lernens. Die Theorie dahinter wird dabei anhand von Praxisübungen aus den Bereichen Clustering, Virtuelle Sensoren und Zeitreihenvorhersage vermittelt. In diesem Modul werden Sie sich hauptsächlich mit der Anwendung des Machine Learning auf numerischen Daten beschäftigen.

 

Abgerundet wird der Kurs durch das dritte Modul Natural Language Processing (NLP) mit R, bei dem Sie sich mit der Anwendung des Maschinellen Lernens im Kontext der natürlichen Sprachverarbeitung auseinandersetzen. Nach dem Kurs können Sie z. B. einen eigenen Chatbot zu entwickeln, auch auf der Basis von ChatGPT.

 

Feedbacks unserer Teilnehmer: https://www.provenexpert.com/dhl-data-science-seminare-gmbh/

Termin Ort Preis*
13.05.2024- 17.05.2024 online 3.159,45
23.09.2024- 27.09.2024 online 3.159,45
18.11.2024- 22.11.2024 online 3.159,45
*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

 

Modul Künstliche Intelligenz mit R (2 Tage)

  • Überblick, Grundlagen und Praxisbeispiele
    • Künstliche Intelligenz
    • Data Science
    • Maschinelles Lernen
    • Herausforderungen bei der Umsetzung eines Data Science/KI Projekts
    • Praxisbeispiele u.a. zu den Themen:
      • Natural Language Processing (NLP)
      • Bilderkennung
      • Predictive Maintenance
      • Prozessindustrie
      • Logistik
  • Intensivkurs R
    • Einführung in R: Datenstrukturen (Listen, Vektoren und Data Frames), Kontrollstrukturen (Fallunterscheidungen, Schleifen und benutzerdefinierte Funktionen) und Erstellung von Diagrammen (ggplot2, plotly)
    • Relevante R-Pakete: Tidyverse, Caret und Keras/Tensorflow
    • Data Science mit R: Statistiken, Korrelationen, Vorverarbeitung
    • Praxis-Übung: Datenzugriff, Datenexplorierung und Visualisierung
  • Methoden des Maschinelles Lernen
    • Überwachtes Lernen/Supervised Learning
    • Unüberwachtes Lernen/Unsupervised Learning
    • Reinforcement Learning
    • Praxis-Übung: Selektion der richtigen Features
  • Data-Science-Zyklus
    • Datenverständnis und Vorbereitung
    • Aufsetzen des Data-Science-Zyklus: Train-Test-Split, Pipelines, Kreuzvalidierung/Crossvalidaton, Hyperparameter-Optimierung
    • Implementierung eines Machine Learning Algorithmus (Learning Vector Quantization)
    • Evaluation des Algorithmus
    • Praxis-Übung: Clustering und Klassifikation

 

Modul Machine Learning mit R (2 Tage)

  • Praxis-Beispiel I (Clustering)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung I: Dimensionalitätsreduzierung mit einer Principal Components Analysis (PCA)
    • Praxis-Übung II: Kategorie-Einteilung von Service-Einsätzen mittels KMeans und Density-Based Spatial Clustering of Applications with Noise (DBSCAN)
  • Praxis-Beispiel II (Virtueller Sensor)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung: Vorhersage eines (meistens nicht direkt messbaren) Wertes anhand vorhandener Variablen/Merkmale mittels Decision Trees, Random Forest und XGBoost und Evaluation mittels Feature Importance
  • Praxis-Beispiel III (Trendvorhersage)
    • Einführung in den Kontext und die Daten
    • Zielsetzung und Methodennutzung
    • Praxis-Übung I: Zeitreihenvorhersage mittels Random Forest, XGBoost und Neuronalen Netzen
    • Praxis-Übung II: Mulitvariate Zeitreihenvorhersage mittels Long-Short-Term-Memory (LSTM) inkl. eiterführende Python-Bibliotheken: keras, tensorflow

 

Modul Natural Language Processing (NLP) mit R (1 Tag)

  • Web Scraping und Crawling
    • Kommerzielle und ethische Gesichtspunkte
    • Scrapen einer Webseite: requests, robots.txt, html, regex
    • Praxis-Übung: Scrapen einer Webseite
  • Vorverarbeitung von Text
    • Parsing: Tokenizer, Stopwords, Stemming, n-grams
    • Praxis-Übung: Parsen von Data-Science-Texten
  • Praxis-Beispiel I (Topic Clustering)
    • Kurze Einführung in den Kontext und die Zielsetzung
    • Praxis-Übung: Unüberwachtes Lernen/Unsupervised Learning (DBSCAN)
  • Praxis-Beispiel II (Sentiment Analysis)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Praxis-Übung: Überwachtes Lernen/Supervised Learning (Neuronale Netze)
  • Praxis-Beispiel III (Sentence Completion)
    • Kurze Einführung in den Kontext, die Daten und die Zielsetzung
    • Praxis-Übung: Symbolische Zeitreihenvorhersage (Long-Short-Term-Memory/LSTM und Embedding)
Dauer/zeitlicher Ablauf:
2-5 Tage (9-17 Uhr)
Ziele/Bildungsabschluss:

Am Ende des Data Science Crash Course mit R werden Sie:

  • die aktuelle Berichterstattung zu Künstliche Intelligenz, Maschinellem Lernen, Reinforcement Learning und Data Science sowie deren Anwendungspotential in verschiedenen Bereichen wie Logistik, Predictive Maintenance oder Chatbots inhaltlich einordnen und bewerten können,
  • vorhandene Daten mit R und Methoden des Maschinellen Lernens für Ihren Bereich nutzbar machen können (unter Einsatz der R-Pakete Tidyverse, Caret und Keras/Tensorflow),
  • die Programmiersprache R und den wissenschaftlichen Rechenstapel von R zur Implementierung von Maschinellen Lernalgorithmen kennengelernt haben, um zu wissen, welche Daten für die erfolgreiche Umsetzung einer Fragestellung aus Ihrem Bereich (noch) notwendig sind,
  • ein vollständigen Data-Science-Zyklus umgesetzt haben und damit wissen, was hierfür notwendig ist und welche Herausforderungen auf Sie zukommen werden,
  • eine Kategorien-Einteilung/Clustering mit Unüberwachtem Lernen/Unsupervised Learning (PCA, k-Means, DBSCAN) durchführen können,
  • eine Trendvorhersage mit Überwachtem Lernen/Supervised Learning (Neuronale Netze, XGBoost, LSTM) durchführen können,
  • einen Virtuellen Sensor mit Überwachtem Lernen/Supervised Learning (Decision Tree, Random Forest, XGBoost) entwickeln können,
  • wissen, was Sie beachten müssen, wenn Sie Daten aus dem Internet ziehen (Web Scraping und Web Crawling) – und wie Sie Daten von einer Seite “scrapen” und vorverarbeiten können,
  • wie Sie Texte mittels Tokenizer, Stopwords, Stemming und n-grams vor-verarbeiten bzw. parsen können und
  • einen praktischen Einblick erhalten, wie Sie Topic Clustering, eine Sentiment Analyse und Satz-Vervollständigung mittels Unsupervised und Supervised Learning durchführen können.
Teilnahmevoraussetzungen:
Für den Data Science Crash Course mit R sind Grundverständnisse der Linearen Algebra (Vektoren, Matrizen) und ein Basiswissen in der Statistik (wie Korrelationen, Signifikanztests, lineare Regression) sehr empfehlenswert. Sie sollten Grundkenntnisse in einer Programmiersprache besitzen, am besten wäre eine Skriptsprache wie R, Python oder Matlab. Liegen keine Programmierkenntnisse vor, können Sie den dafür entwickelten Vorbereitungskurs Einführung in die Programmierung mit R besuchen.
Technische Voraussetzungen:

Sie nehmen an einem Live-Online-Training teil, der vom Ablauf und der Qualität unseren Präsenztrainings entspricht.  Mit der heutigen Technik kommt das Präsenz-Seminar zu Ihnen an den Arbeitsplatz bzw. ins Home-Office. Der Dozent führt in die Themen ein, beantwortet die Fragen der Teilnehmer und geht in den Übungsrunden auf jeden Teilnehmer persönlich ein. Bei Fragen oder Problemen können Sie dem Dozenten Ihren Bildschirm freigeben.

Ein Teilnehmer unserer Kurse schreibt: „Obwohl ich wegen Online Seminar sehr skeptisch gegenüber stand, kann ich dem Dozenten wirklich nur dafür gratulieren, wie gut dieser dieses Seminar umgesetzt hat. Dies könnte man wohl auch nicht besser bei einer Vorort-Schulung machen. Daher kann ich dieses Seminar nur wirklich sehr empfehlen.“ Lesen Sie weitere Rezensionen unserer Teilnehmer unter https://www.provenexpert.com/dhl-data-science-seminare-gmbh/.

Alles, was Sie brauchen, ist ein PC oder Laptop mit folgenden Merkmalen:

  • Es ist die Statistik-Software installiert, mit der der Kurs durchgeführt wird. Sie erhalten dazu nach der Anmeldung eine detaillierte Installationsanleitung.
  • Der Laptop hat Zugang zum Internet mit einer empfohlenen Bandbreite von mindestens 1-2 MBit/s.
  • Entweder installieren Sie unsere Webinar-Software oder Sie nehmen an dem Webinar mit einem Internet-Browser (Google Chrome oder Firefox) teil.
  • Testen Sie die Funktionsfähigkeit von Kamera, Mikrofon und Lautsprecher Ihres PCs/Laptops.
  • Von Vorteil wäre die Verwendung von zwei Geräten/Monitoren: Auf dem einen Gerät/Monitor (z. B. Laptop oder Tablet) sehen Sie die Präsentation des Dozenten oder Unterrichtsmaterialien. Auf dem anderen Gerät/Monitor (z. B. PC oder Laptop) können Sie parallel dazu das Gelernte direkt anwenden und Übungsaufgaben lösen.

Bei unseren Präsenzveranstaltungen in Stuttgart nehmen Sie bitte einen Laptop mit (Sie erhalten eine Installationsanleitung für die erforderliche Software).

Bei Inhouse-Seminaren werden Seminarraum und technische Geräte (Beamer, Leinwand, PCs/Laptops) vom Kunden zur Verfügung gestellt. Gegen Aufpreis können wir bundesweit in allen größeren Städten einen Seminarraum mit den technischen Geräten organisieren. Auf Wunsch können wir auch ein Online-Firmenseminar durchführen.

Lehrgangsverlauf/Methoden:
  • Rahmen: 2-5 Tage mit 16-40 Stunden Unterricht (täglich 8 Stunden, 9-17 Uhr)
  • Aufteilung Theorie/Praxis: 40 % Theorie + 60 % Praxis mit Übungen
Material:

Präsenztrainings

  • Seminarräume in zentraler Lage
  • gedruckte Schulungsunterlagen 
  • persönliche Betreuung der Teilnehmer in den Übungsblöcken
  • Getränke in den Pausen
  • ein Zertifikat mit den Schulungsinhalten


Live-Online-Trainings

  • multimedialer Online-Unterricht mit Webex oder Zoom
  • umfangreiche Online-Materialien
  • persönliche Betreuung der Teilnehmer in den Übungsblöcken
  • ein Zertifikat mit den Schulungsinhalten
Förderung:
Bildungsurlaub, Bildungsscheck, Bildungsprämie, kein Bildungsgutschein
Zielgruppe:
  • Beschäftigte aus operativen Bereichen, R&D und IT mit grundlegenden Programmierkenntnissen, welche die Potenziale von Data Science, Künstlicher Intelligenz und Maschinellem Lernen kennenlernen und hautnah erfahren möchten und
  • Anwender, Studenten, Doktoranden und Forscher aus den mathematischen, statistischen, naturwissenschaftlichen, ingenieurwissenschaftlichen, informationstechnologischen, medizinischen, pharmazeutischen, betriebs-, wirtschafts-, markt- und sozialwissenschaftlichen Bereichen
Seminarkennung:
DSR
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha