955401 VU Fundamentals of Data Analytics

Wintersemester 2018/2019 | Stand: 22.10.2018 LV auf Merkliste setzen
955401
VU Fundamentals of Data Analytics
VU 2
5
Block
jährlich
Englisch

Überblick und Kenntnisse moderner Werkzeuge zur Datenanalyse. Fähigkeit zur selbständigen Durchführung von datenwissenschaftlichen Grundlagenprojekten, einschließlich der Auswahl einer geeigneten datengetriebenen Methode und der Kommunikation der entsprechenden Ergebnisse.

Inhalt:

Woche 1:

  - Modulübersicht und R-Einführung.

  - Datenerfassung, Web-Scraping und Reinigung.

  - Explorative Analyse.

  - Tests.

  - Lineare Regression.

Woche 2:

  - Reproduzierbarkeit, Berichterstattung und Kommunikation:

      R/Markdown, Webanwendungen, Dashboards.

  - Unüberwachtes Lernen:

      Clustering, Hauptkomponentenanalyse und Faktorenanalyse.

  - Variablen- und Modellauswahl.

  - Verallgemeinerte lineare Modelle (GLM).

  - Verallgemeinerte additive Modelle (GAM).

* Woche 3:

  - Tutorials.

  - Projektpräsentationen.

Jede der Sitzungen beginnt mit einem Vortrag am Vormittag, gefolgt von einer Diskussion. Im Anschluss daran werden die erlernten Methoden in einer angewandten Sitzung mit Hilfe der statistischen Programmierumgebung R (https://www.R-project.org/) auf reale Datenprobleme angewandt. Nach jedem Tag wird eine Hausaufgabe erteilt, die für die nächste angewandte Sitzung vorbereitet werden muss. Die Hausaufgaben werden von den Studenten zu Beginn der angewandten Sitzungen präsentiert. Am Ende des Kurses steht ein datenwissenschaftliches Projekt, das 60% der erreichbaren Punkte abdeckt. Alle Hausaufgaben decken 40% der erreichbaren Punkte ab.

Schriftlich und mündlich

Entsprechende Referenzen werden hauptsächlich in den Folien dargestellt. Empfohlene Lehrbücher sind:

*Yihui Xie, J. J. Allaire, Garrett Grolemund (2018). R Markdown: The Definitive Guide.

   Chapman & Hall/CRC. ISBN 9781138359338.

   URL: https://bookdown.org/yihui/rmarkdown

* Wickham H, Grolemund G (2017). R for Data Science: Import, Tidy, Transform, Visualize,

    and Model Data. 1st Edition, O'Reilly.

    URL: http://r4ds.had.co.nz/

* Yihui Xie (2015). Dynamic Documents with R and knitr. 2nd edition.

   Chapman and Hall/CRC. ISBN 978-1498716963

   URL: http://www.crcpress.com/product/isbn/9781498716963
* Venables, W. N. & Ripley, B. D. (2002) Modern Applied Statistics with

   S. Fourth Edition. Springer, New York. ISBN 0-387-95457-0

Voraussetzung(en): Grundkenntnisse aus der statistischen Datenanalyse. Grundkenntnisse in Programmierung mit R ist von Vorteil.

22.10.2018
Gruppe 0
Datum Uhrzeit Ort
Mo 22.10.2018
14.00 - 18.00 SR 7 (Sowi) SR 7 (Sowi) Barrierefrei
Di 23.10.2018
16.00 - 19.00 SR 7 (Sowi) SR 7 (Sowi) Barrierefrei
Mi 24.10.2018
12.00 - 15.00 SR 7 (Sowi) SR 7 (Sowi) Barrierefrei
Mo 29.10.2018
14.00 - 17.00 SR 7 (Sowi) SR 7 (Sowi) Barrierefrei
Di 30.10.2018
16.00 - 19.00 SR 7 (Sowi) SR 7 (Sowi) Barrierefrei
Mi 31.10.2018
12.00 - 16.00 SR 7 (Sowi) SR 7 (Sowi) Barrierefrei
Mo 05.11.2018
14.00 - 16.00 SR 7 (Sowi) SR 7 (Sowi) Barrierefrei
Mi 07.11.2018
12.00 - 14.00 SR 7 (Sowi) SR 7 (Sowi) Barrierefrei
Fr 09.11.2018
09.00 - 12.45 ZID Sowi AR 5 ZID Sowi AR 5