720261 SE Seminar zu speziellen Problemen der psychologischen Grundlagenforschung: 'Fortgeschrittene Data Science mit R

Wintersemester 2026/2027 | Stand: 02.06.2026 LV auf Merkliste setzen
720261
SE Seminar zu speziellen Problemen der psychologischen Grundlagenforschung: 'Fortgeschrittene Data Science mit R
SE 2
3
wöch.
semestral
Deutsch

Data Science ist eine anspruchsvolle Disziplin, die komplexe, hochdimensionale Daten in handlungsrelevantes Wissen (actionable intelligence), systemische Erkenntnisse und strategisches Wissen transformiert. Dieser Kurs richtet sich an Master-Studierende und Promovierende. Er konzentriert sich auf die Beherrschung fortgeschrittener Paradigmen und algorithmischer Frameworks innerhalb des R-Ökosystems, um End-to-End-Data-Science-Pipelines zu implementieren. Die Teilnehmenden werden robuste Workflows zur Datenerfassung konzipieren, stringente Datenmodellierungsmethoden umsetzen und anspruchsvolle Visualisierungen entwickeln, um verborgene Muster in komplexen Datensätzen aufzudecken. Besonderer Wert wird auf Datenvalidierung, Reproduzierbarkeit und die theoretischen Grundlagen des Statistical Computing gelegt.

1. Algorithmische Datenerfassung & Schema-Engineering

  • Pipeline-Design: Entwicklung skalierbarer Pipelines zur Erfassung und Transformation heterogener Daten in optimierte, strukturierte Data Frames.
  • Architektur & Normalisierung: Implementierung fortgeschrittener Datennormalisierung und Tidy Data-Architekturen, die präzise auf domänenspezifische Semantiken abgestimmt sind.
  • Datenmanipulation: Durchführung komplexer Datenmanipulationsstrategien, einschließlich hochperformanter Teilmengenbildung (subsetting), Feature-Engineering und der Aggregation mehrdimensionaler Kennzahlen.
  • Datenbank-Integration: Fortgeschrittene Integration von R mit relationalen Datenbankmanagementsystemen (RDBMS).

2. Explorative Datenanalyse (EDA) & Multivariate Visualisierung

  • Strukturanalyse: Nutzung hochentwickelter grafischer Frameworks, um verborgene Strukturen, Anomalien und Interaktionen zwischen mehreren Variablen in komplexen Datensätzen offenzulegen.
  • Hypothesenbildung: Formulierung datengestützter Hypothesen durch iterative, visuelle Diagnosetechniken.
  • Statistische Modellierung: Entwicklung und Evaluierung statistischer Modelle zur Quantifizierung, Vorhersage und Ableitung von Beziehungen zwischen multivariaten Parametern.

3. Reproduzierbare Forschung & Literate Programming

  • Technische Berichte: Nutzung moderner Kommunikations-Frameworks (z. B. Quarto, R Markdown), um Code, statistische Modelle und dynamische Visualisierungen in reproduzierbare, produktionsreife technische Berichte und Computational Notebooks zu integrieren.

Unterricht + Übungen

Regelmäßige Beiträge beim Seminar und Vorbereitung eines Referats

Wickham und Grolemund, R for Data Science, 2. Auflage, edition O'Reilly (auf Englisch, online verfügbar)

siehe Termine
  • SDG 4 - Hochwertige Bildung: Inklusive, gleichberechtigte und hochwertige Bildung gewährleisten und Möglichkeiten lebenslangen Lernens für alle fördern
Gruppe Anmeldefrist
01.09.2026 00:00 - 21.09.2026 23:59
Hinweis:

Sie müssen für jede Lehrveranstaltung dieses Bereichs Ihre Präferenz abgeben!!

Aufgrund der Präferenzvergabe wird eine möglichst gerechte Verteilung per Zufall unter der Berücksichtigung Ihrer Präferenzen gewährleistet!

Überprüfen Sie unbedingt Ihre Anmeldung in LFU:online. Alle Prüfungen, die bis zum Ende der Anmeldefrist elektronisch erfasst worden sind, werden automatisch bei der Seminarplatzvergabe berücksichtigt.

Ausführliches können Sie auf unserer Homepage nachlesen.

------------

Im Laufe des 22.09.2026 finden Sie Ihre bearbeiteten Anmeldungen in LFU:online im Bereich "meine LV Anmeldungen".

Viviani R.