Einführung in die Datenanalyse
Introduction to Data Analysis
Modul PH2099
Modulversion vom SS 2021 (aktuell)
Von dieser Modulbeschreibung gibt es historische Versionen. Eine Modulbeschreibung ist immer so lange gültig, bis sie von einer neuen abgelöst wird.
Ob die Lehrveranstaltungen des Moduls in einem spezifischen Semester angeboten werden, finden Sie im Abschnitt Lehrveranstaltungen, Lern- und Lehrmethoden und Literaturhinweise unten.
verfügbare Modulversionen | |||||
---|---|---|---|---|---|
SS 2021 | SS 2020 | SS 2019 | SS 2018 | WS 2016/7 | WS 2010/1 |
Basisdaten
PH2099 ist ein Semestermodul in Deutsch oder Englisch auf Master-Niveau das im Wintersemester angeboten wird.
Das Modul ist Bestandteil der folgenden Kataloge in den Studienangeboten der Physik.
- Spezifischer Spezialfachkatalog Kern-, Teilchen- und Astrophysik
- Komplementärer Spezialfachkatalog Physik der kondensierten Materie
- Komplementärer Spezialfachkatalog Biophysik
- Komplementärer Spezialfachkatalog Applied and Engineering Physics
Soweit nicht beim Export in einen fachfremden Studiengang ein anderer studentischer Arbeitsaufwand ("Workload") festgelegt wurde, ist der Umfang der folgenden Tabelle zu entnehmen.
Gesamtaufwand | Präsenzveranstaltungen | Umfang (ECTS) |
---|---|---|
150 h | 60 h | 5 CP |
Inhaltlich verantwortlich für das Modul PH2099 ist Boris Grube.
Inhalte, Lernergebnisse und Voraussetzungen
Inhalt
In dem Modul werden grundlegende Methoden zur Analyse experimenteller Daten eingeführt. Unter anderem werden die folgenden Themen behandelt:
- die wissenschaftliche Methode
- das Konzept von Wahrscheinlichkeit und seine Interpretationen
- Satz von Bayes
- Zufallsvariablen
- Wahrscheinlichkeitsverteilungen und ihre Momente
- wichtige Wahrscheinlichkeitsverteilungen: Binomial-, Multinomial-, Poisson- und Gauß-Verteilung
- Multivariate Verteilungsfunktionen
- Marginalverteilung und bedingte Verteilung
- Kovarianz und Korrelationskoeffizient
- Funktionen von (mehreren) Zufallsvariablen
- Zentraler Grenzwertsatz
- Gaußsche Fehlerfortpflanzung für n-dimensionale Funktionen und Kovarianzmatrix
- statistische und systematische Unsicherheiten
- Schätzung von Parameterwerten mit der Methode der kleinsten Quadrate
- Schätzung der Anpassungsgüte
- Schätzung von Parameterwerten mit der (erweiterten) Maximum-Likelihood-Methode
- Zusammenhang zwischen der Methode der kleinsten Quadrate und der Maximum-Likelihood-Methode
- Schätzung der Signifikanz von Signalen
Lernergebnisse
Nach erfolgreicher Teilnahme an diesem Modul sind die Studierenden in der Lage
- fundamentale statistische Konzepte zu verstehen und anzuwenden
- grundlegende Datenanalysemethoden zu verstehen und auf geeignetet Daten anzuwenden
- Fehlerfortpflanzung 1. Ordnung im allgemeinen Fall anzuwenden
- statistische und systematische Unsicherheiten abzuschätzen und korrekt zu interpretieren
- Modellparameter durch Anpassung an (hochdimensionale) Daten zu schätzen
- die statistische Signifikanz von Signalen bei nichtverschwindendem Untergrund zu schätzen
- (Bei Teilnahme and den Tutorien) Python Programme für Datenanalyseprobleme mit moderater Komplexität zu entwickeln
Voraussetzungen
Keine Vorkenntnisse nötig, die über die Zulassungsvoraussetzungen zum Masterstudium hinausgehen.
Lehrveranstaltungen, Lern- und Lehrmethoden und Literaturhinweise
Lehrveranstaltungen und Termine
Art | SWS | Titel | Dozent(en) | Termine | Links |
---|---|---|---|---|---|
VO | 2 | Introduction to Data Analysis | Grube, B. |
Mo, 14:00–16:00 |
eLearning |
UE | 2 | Exercise to Introduction to Data Analysis | Grube, B. | Termine in Gruppen |
eLearning |
Lern- und Lehrmethoden
Das Modul besteht aus einer Vorlesung und einer Übung.
Das Ziel der Vorlesung ist es, ein solides theoretisches Fundament zu vermitteln. Dazu werden, wenn möglich, Methoden und Konzepte aus fundamentalen Prinzipien hergeleitet.
In den Übungen werden die in der Vorlesung erklärten Konzepte auf konkrete Beispiele angewandt. Dabei werden in Gruppenarbeit kurze Python-Programme entwickelt. Die Beispiele stammen hauptsächlich aus dem Bereich der Teilchenphysik. Die Übungen fokussieren sich jedoch auf die statistischen Aspekte der behandelten Probleme und sind so aufbereitet, dass kein tieferes Vorwissen in Teilchenphysik erforderlich ist.
Medienformen
Präsentation via Beamer, Tafelarbeit, Smartboard, Übungsblätter
Literatur
- G. Cowan: Statistical data analysis, Oxford University Press, (1998)
- R. J. Barlow: Statistics: A Guide to the Use of Statistical Methods in the Physical Sciences, Wiley, (2008)
- S. Brandt: Datenanalyse für Naturwissenschaftler und Ingenieure, Springer Spektrum, (2013)
- B. Roe: Probability and Statistics in Experimental Physics, Springer, (2001)
- M.G. Kendall & A. Stuart: The Advanced Theory of Statistics Vol I-III, Charles Griffin, (1961)
- V. Blobel & E. Lohrmann: Statistische und numerische Methoden der Datenanalyse, Teubner Studienbücher Verlag, (1998)
- D.S. Sivia & J. Skilling: Data Analysis: a Bayesian Tutorial, Oxford University Press, (2006)
- P.R. Bevington & D.K. Robinson: Data Reduction and Error Analysis for the Physical Sciences, McGraw-Hill, (2002)
- L. Lyons: Statistics for Nuclear and Particle Physicists, Cambridge University Press, (1989)
Modulprüfung
Beschreibung der Prüfungs- und Studienleistungen
Es findet eine mündliche Prüfung von 30 Minuten Dauer statt. Darin wird das Erreichen der im Abschnitt Lernergebnisse dargestellten Kompetenzen mindestens in der dort angegebenen Erkenntnisstufe exemplarisch durch Verständnisfragen überprüft.
Prüfungsaufgabe könnte beispielsweise sein:
- Was ist die mathematische Definition von Wahrscheinlichkeit?
- Was ist die Methode der kleinsten Quadrate?
- Was ist die Maximum-Likelihood-Methode?
Die Teilnahme am Übungsbetrieb wird dringend empfohlen, da die Übungsaufgaben auf die in der Modulprüfung abgefragten Problemstellungen vorbereiten und somit die spezifischen Kompetenzen eingeübt werden.
Wiederholbarkeit
Eine Wiederholungsmöglichkeit wird am Semesterende angeboten.