Seminare

Grundlagen der Statistik mit Python (3-5 Tage)

Seminar - DHL Data Science Seminare GmbH

Der Kurs bietet eine verständnisorientierte Einführung in die zentralen statistischen Verfahren der angewandten Statistik. Sie erhalten eine fundierte Einführung in die grundlegenden Funktionen der Programmiersprache Python aus der Anaconda-Distribution unter der Entwicklungsumgebung Spyder mit den gängigen Methoden und Verfahren des Datenimports, der Datenaufbereitung, der statistischen Datenanalyse und der Präsentation von Ergebnissen. Der Lehrstoff wird unter Zuhilfenahme professioneller Didaktik durch den Wechsel von Input und anwendungsbezogenen Übungen mit Python vermittelt.

In dem Python Seminar wird Wert auf den Anwendungsbezug gelegt. Die Übungsaufgaben erfolgen mit der statistischen Programmiersprache Python und der Entwicklungsumgebung Spyder. Durch intensives Trainieren mit ständigen Übungen und Wiederholungen anhand von über einem Dutzend Datensätzen aus den Bereichen der Markt- und Meinungsforschung, der medizinischen Forschung mit klinischen Studien und der Technik/Produktion wird ein vertieftes Verständnis der statistischen Verfahren und ein sicherer Umgang mit Python sichergestellt.

Dieses Python Seminar vermittelt über die Einführung in statistische Grundlagen hinaus Expertenwissen für statistische Datenanalysen. Es werden reale Daten mit typischen Stolpersteinen verwendet und es wird dabei aufgezeigt, wie durch unachtsame Anwendung der Standardverfahren verzerrte oder sogar nicht zutreffende und falsche Ergebnisse entstehen können.
Termin Ort Preis*
14.09.2020- 18.09.2020 Berlin 2.639,00 €
12.10.2020- 16.10.2020 München 2.639,00 €
09.11.2020- 13.11.2020 Köln 2.639,00 €
*Alle Preise verstehen sich inkl. MwSt.

Detaillierte Informationen zum Seminar

Inhalte:

Der Python Kurs Grundlagen der Statistik mit Python besteht aus einem dreitägigen Basistraining und einem zweitägigen Aufbautraining, die voneinander unabhängig besucht werden können. Im Basistraining werden sowohl die Grundlagen zu Python und als auch die Grundlagen der Statistik gelegt. Im Aufbautraining des Python Kurses wird in die Automatisierung statistischer Verfahren und in die Varianzanalyse eingeführt und damit die Grundlagen für die Massenverarbeitung von Daten gelegt.

Das Basistraining bietet eine Einführung in folgende statistische Konzepte und Grundbegriffe und deren Umsetzung mit Hilfe von Python: Grundgesamtheit, Stichprobe, Variablen, Häufigkeiten, Dateneingabe, Datenimport, Datenaufbereitung, Datenanalyse, die statistische Beschreibung von Stichproben mit Zentral-, Streuungs- und Zusammenhangsmaßen (deskriptive Statistik), Hypothesentests, parametrische und verteilungsfreie Signifikanztests und die Darstellung von statistischen Ergebnissen mit Grafiken wie Histogrammen, Balkendiagrammen, Kreisdiagrammen, Boxplots, Streudiagrammen und Liniendiagrammen.

In dem Aufbautraining wird zunächst in die Automatisierung statistischer Verfahren eingeführt. Es wird gezeigt, wie mit Hilfe von Fallunterscheidungen und Schleifen der Programmfluss gesteuert werden kann und mit Hilfe von benutzerdefinierte Funktionen häufig wiederkehrende Aufgaben vereinfacht und automatisiert werden können. Ein weiterer Schwerpunkt in der Aufbauschulung besteht in der Vermittlung der Anwendung der Varianzanalyse. Die Varianzanalyse erlaubt die simultane Analyse einer Vielzahl von Mittelwerten verschiedener Einflussgrößen bzw. (Teil-) Stichproben und ist hinsichtlich Präzision und Arbeitsaufwand ein Vielfaches dem t-Test für den Mittelwertsvergleich überlegen.


Inhalte des Basis-Trainings

  • Grundfunktionen von Python lernen (Arbeiten mit Python, IPython und Spyder; Datenstrukturen mit NumPyund Pandas; Eingeben, Einlesen, Umkodieren, Transformieren, Umstrukturieren, Gruppieren und Auswählen von Daten; Erstellen und Bearbeiten von Diagrammen mit Matplotlib; Exportieren von Ausgaben in andere Anwendungen)
  • Messtheoretische Grundlagen (Grundgesamtheit und Stichprobe, Messung und Skalenniveaus)
  • Univariate Deskriptivstatistik (Häufigkeitsverteilungen, Zentralmaße, Streuungsmaße, Standardwerte, Grafiken)
  • Bivariate Deskriptivstatistik (Korrelationen, Streudiagramme und Streudiagramm-Matrizen mit LOESS-Kurven)
  • Einführung in die Inferenzstatistik (statistisches Testen anhand von Stichproben, Nullhypothesentest nach Fisher, Signifikanz, Effektgröße, Konfidenzintervall)
  • Signifikanztests (parametrische Verfahren: z-Test und t-Test für eine Stichprobe zur Prüfung der Abweichung eines Mittelwerts von einem vorgegebenen Wert, t-Tests zur Signifikanzprüfung des Unterschieds zweier Mittelwerte aus unabhängigen oder verbundenen Stichproben, F-Test und Levene-Test zur Signifikanzprüfung von Varianzen, Kolmogoroff-Smirnow-Test, Anderson-Darling-Test und Shapiro-Wilk-Test zur Signifikanzprüfung der Normalverteilungsannahme, Signifikanzprüfung von Korrelationskoeffizienten; nonparametrische Verfahren: U-Test von Wilcoxon-Mann-Whitney und Wilcoxon-(Vorzeichenrang-)Test zur Signifikanzprüfung von Medianen, Binomialtest, Chi-Quadrat-Tests und exakter Test nach Fisher zur Signifikanzprüfung von Häufigkeiten, Kontingenzanalysen zweier Merkmale mit Kreuztabellen)
  • Prüfung der Wirksamkeit von Aktionen, Maßnahmen, Interventionen und anderen Veränderungen mit t-Tests (Pretest-Posttest-Designs mit zwei Gruppen)


Inhalte des Aufbautrainings

  • Automatisierung statistischer Verfahren
    • Programmstrukturen (Fallunterscheidungen und Schleifen)
    • Benutzerdefinierte Funktionen
    • Fehlersuche und Fehlerbehebung bei Python-Skripten
    • Fallbeispiel: Automatisierung von t-Tests
  • Methoden zum differenzierten Mittelwertvergleich von mehreren Gruppen:
    • ein-, zwei- und mehrfaktorielle Varianzanalyse
    • Berücksichtigung von speziellen Effekten (bei Messwiederholungen, Zufalls- und Störeinflüssen)
    • t-Tests im Rahmen der Varianzanalyse (Post-hoc-Mehrfachvergleiche: Tukey HSD, Duncan/SNK, Games-Howell, Dunnett; paarweise Einzelvergleiche mit Alphafehler-Korrektur: Bonferroni, Sidak, Jianjun Li)
    • Interaktionsanalyse (Wechselwirkungen aufgrund sich verstärkender oder hemmender Effekte)
    • Statistische Auswertung von Pretest-Posttest-Designs mit Varianzanalysen
Dauer/zeitlicher Ablauf:
3-5 Tage, 9-18 Uhr
Ziele/Bildungsabschluss:

die Grundfunktionen der Programmiersprache Python lernen, mit der interaktiven Shell IPython und der Entwicklungsumgebung Spyder umgehen lernen, Datenstrukturen mit NumPy und Pandas erstellen, bearbeiten und auswerten können, Daten importieren, aufbereiten und auswerten können, die Grundlagen der Statistik verstehen und anwenden können, Ergebnisse darstellen, erläutern und interpretieren können, Grafiken und Visualisierungen der Daten mit Matplotlib erstellen können

Teilnahmevoraussetzungen:

Es werden für das Basis-Training bzw. für das Komplett-Training allgemeine Computerkenntnisse (Erfahrung in der Anwendung von Textverarbeitungs- und Tabellenkalkulationsprogrammen) und Grundkenntnisse in der Mathematik (Grundkenntnisse in der Statistik sind von Vorteil, aber nicht erforderlich) vorausgesetzt. Im Aufbau-Training werden grundlegende Fertigkeiten im Umgang mit Python, wie Datenimport, Datenaufbereitung, Grafikerstellung und statistische Standardverfahren, vorausgesetzt, ständig angewendet und vertieft.

Technische Voraussetzungen:

Bei unseren Präsenzseminaren bringen Sie bitte einen Laptop mit der entsprechenden Software mit. Eine Installationsanleitung für die Python Anaconda Distribution erhalten Sie nach der Anmeldung. Sie können auf Anfrage einen Schulungslaptop erhalten.

Bei unseren Live-Online-Trainings sitzen Sie an Ihrem Arbeitsplatz – sei es in einem Büro, in einem Unternehmen, im Home-Office oder im Hotel. Sie nehmen an einem Live-Online-Training teil, der vom Ablauf und der Qualität unseren Präsenztrainings entspricht. Der Dozent führt in die Themen ein, beantwortet die Fragen der Teilnehmer und geht in den Übungsrunden auf jeden Teilnehmer persönlich ein. Es gibt eine Vielzahl digitaler Hilfsmittel wie Whiteboards, persönliche Chats mit dem Dozenten, Kanäle mit Unterrichtsmaterialien usw. Alles, was Sie brauchen, ist ein Laptop, der mit folgenden Merkmalen ausgestattet ist:

  • Es ist die Statistik-Software installiert, mit der der Kurs durchgeführt wird. Sie erhalten nach der Anmeldung eine detaillierte Installationsanleitung für die Python Anaconda Distribution.
  • Der Laptop hat Zugang zum Internet mit einer empfohlenen Bandbreite von mindestens 2 MBit/s.
  • Entweder installieren Sie unsere Webinar-Software oder Sie nehmen an dem Webinar mit Google Chrome oder Microsoft Edge teil (Firefox, Safari und IE werden nicht unterstützt).
  • Bei Verwendung eines Laptops: Testen Sie die Funktionsfähigkeit von Kamera, Mikrofon und Lautsprecher.
  • Bei Verwendung eines PCs: Schließen Sie eine Webcam und Lautsprecher an und testen Sie deren Funktionen.
  • Ein Headset wäre empfehlenswert, wenn auch nicht notwendig, wenn vorhandene Geräte funktionieren.
  • Von Vorteil wäre die Verwendung von zwei Geräten/Monitoren: Auf dem einen Gerät/Monitor (z. B. Tablet) sehen Sie die Präsentation des Dozenten oder Unterrichtsmaterialien. Auf dem anderen Gerät/Monitor (z. B. PC oder Laptop) können Sie parallel dazu das Gelernte direkt anwenden und Übungsaufgaben lösen.
Lehrgangsverlauf/Methoden:
offene 5-Tages-Schulung mit 2-10 Teilnehmer
täglicher Unterricht 9-18 Uhr mit drei Pausen
Material:


Präsenztrainings

  • Seminarräume in zentraler Lage
  • gedruckte Schulungsunterlagen 
  • persönliche Betreuung der Teilnehmer in den Übungsblöcken
  • Getränke in den Pausen
  • ein Zertifikat mit den Schulungsinhalten


Live-Online-Trainings

  • multimedialer Online-Unterricht mit Teams und Zoom
  • umfangreiche Online-Materialien
  • Aufzeichung der Lerneinheiten (herunterladbar)
  • persönliche Betreuung der Teilnehmer in den Übungsblöcken
  • ein Zertifikat mit den Schulungsinhalten
Förderung:
Bildungsscheck, Bildungsprämie, kein Bildungsgutschein
Zielgruppe:

Der Kurs ist für Personen mit wenig Erfahrung in Statistik und Programmierung konzipiert, die eine Einführung in die Statistik suchen und Python lernen möchten. Inhaltlich richtet sich das Python Seminar an Anwender, Fachkräfte, Doktoranden und Studierende aus den Bereichen der Sozial- und Marktforschung, der Wirtschaftswissenschaften und der Betriebswirtschaft (Marketing, Business Intelligence, Produktion) und der psychologischen, klinischen, pharmazeutischen und biologischen Forschung.

Seminarkennung:
2020-11K-GSP
Nach unten
Nach oben
Wir setzen Analyse-Cookies ein, um Ihre Zufriedenheit bei der Nutzung unserer Webseite zu verbessern. Diese Cookies werden nicht automatisiert gesetzt. Wenn Sie mit dem Einsatz dieser Cookies einverstanden sind, klicken Sie bitte auf Akzeptieren. Weitere Informationen finden Sie hier.
Akzeptieren Nicht akzeptieren









Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha



Bei der Verarbeitung Ihrer personenbezogenen Daten im Zusammenhang mit der Kontaktfunktion beachten wir die gesetzlichen Bestimmungen. Unsere ausführlichen Datenschutzinformationen finden Sie hier. Bei der Kontakt-Funktion erhobene Daten werden nur an den jeweiligen Anbieter weitergeleitet und sind nötig, damit der Anbieter auf Ihr Anliegen reagieren kann.







Um Spam abzuwehren, geben Sie bitte die Buchstaben auf dem Bild in das Textfeld ein:

captcha