# Hausaufgaben zur 11. Woche
## Aufgabe 1: Sensitivität und Spezifizität
Diese Tabelle habe ich auf dem Beibackzettel eines Corona-Schnelltests vom Aldi (Hersteller: Hotgen) gefunden:

**(a)** Nutzen Sie R, um nachzurechnen, ob die Angaben für Sensitivität und Spezifizität, einschließlich der Konfidenzintervalle, korrekt aus den Werten in der Kontigenz-Tafel ermittelt wurden.
**(b)** Kollegen hier am Campus haben im Herbst eine Reihe von Schnelltests überprüft:
Anna Denzler et al., *Rapid comparative evaluation of SARS-CoV-2 rapid point-of-care antigen tests*, biorXiv preprint, [doi:10.1101/2021.07.29.21261314](https://doi.org/10.1101/2021.07.29.21261314)
Der im Paper erwähnte Schnelltest von Hotgen ist wohl nicht genau derselbe, da die Herstellerangabe zur Sensitivität etwas anders war.
Wie Sie Abb. 3B des Preprints entnehmen können, hat jene Version des HotGen-Schnelltest, mit vom Hersteller angegebener Spezifizität 95,37%, ein positives Ergebnis angezeigt bei 3 von 3 Proben mit hoher Viruskonzentration (Ct 21), bei 3 von 4 Proben mit mittlere Viruskonzentration (Ct 21), und bei 0 von 3 Proben mit geringer Viruskonzentration (Ct 28). Bei 3 von 3 tatsächlich negativen Proben zeigte der Schnelltest korrekt ein negatives Ergebnis an.
Erstellen Sie aus diesen Zahlen eine Kontigenztafel wie die im Beipackzettel und berechnen Sie Sensitivität und Spezifizität.
Was bedeutet, übrigens, "Ct"?
**(c\)** Wie bewerten Sie diese Ergebnisse?
**(d)** Sie möchten die Schnelltests von zwei Herstellern vergleichen und bereiten dazu Proben mit mittlerer Viruskonzentration vor. Sie verwenden 10 Schnelltests von Hersteller und erhalten 7 mal ein positives und 3 mal ein negatives Ergebnis. Beim Hersteller B ist es umgekehrt: Sie erhalten 3 mal ein positives und 7 mal ein negatives Resultat.
Ist dieser Unterschied deutlich genug, um zu sagen, dass die Tests von Hersteller A besser sind als die von Hersteller B?
Nehmen Sie dazu an, dass alle Tests genau gleich wären und berechnen Sie die Wahrscheinlichkeit, das man dennoch ein Ergebnis mit diesem oder einem noch stärkeren Unterschied erhält.
## Aufgabe 2: Anteil Adipöser nach Ethnie
In der Hausaufgabe zur 4. Woche haben wir diesen Plot erstellt,
der für jede Ethnie den Anteil Adipöser unter der Bevölerung ermittelt haben.

Inzwischen sind wir schlauer, denn eigentlich sollte man bei jedem Anteil immer das zugehörige binomiale Konfidenzintervall (z.B. nach Wilson) ermitteln und mittels Fehlerbalken einzeichnen.
**(a)** Schauen Sie sich die Musterlösung der 4. Woche nochmal an und erstellen Sie die Tabelle, mit der wir damals den Plot erstellt haben (`tbl_perc_obese` in der Musterlösung).
Sie können den Code einfach aus der Musterlösung kopieren. Oder, wenn Sie möchten, versuchen Sie es zur Übung nochmal selbst:
- Laden Sie die NHANES-Tabellen zu Demographie (DEMO_J.XPT) und Body Measurements (BMX_J.XPT) und verbinden Sie sie mit `inner_join`.
- Berechnen Sie den Body Mass Index mittels `bmi = (height/100) / weight^2`, fügen Sie dann eine Spalte `obese` ein, die TRUE anzeigt, wenn `bmi>=30`, sonst FALSE.
- Gruppieren Sie nach Ethnie, Geschlecht, und Adipositas-Status und zählen Sie die Probanden pro Gruppe (mit `summarize(n())`).
- Nun stellen Sie (mit `pivot_wider`) die Anzahl adipöser und nicht-adipöser pro Gruppe und Ethnie nebeneinander, und erzeugen Sie auch eine Spalte mit der Summe (`obese + not_obese`).
**(b)** Berechnen Sie nun die Konfidenz-Intervalle, indem Sie folgenden Code benutzen:
```r
tbl_perc_obese %>%
mutate( binom.confint( nbr_obese, nbr_total, method="wilson" ))
```
Da `binom.confint` nicht einfach einen Vektor (eine einzelne Spalte) zurückgibt, sondern eine Tabelle mit mehreren Spalten, habe ich hier bei `mutate`, anders als sonst, keinen Spaltennamen angegeben. So werden einfach mehrere neue Spalten angehängt.
**(c\)** Erstellen Sie nun eine Version des Plots mit Fehlerbalken.
Zwei Tipps:
- Falls Sie nicht mehr wissen, wie man Fehlerbalken zeichnet, schauen Sie in die Musterlösung der 5. Woche.
- Anstatt Männer und Frauen mittels `position="dodge"` in einen Plot zu setzen (wie wir es in der 4. Woche gemacht haben), könnte es einfacher sein, die Geschlechter mit `facet_grid` auf zwei Subplots aufzuteilen.
## Umfrage
Wie sind Sie mit diesen Aufgaben zurecht gekommen? Bitte geben Sie mir kurz Feedback mittels folgender Umfrage: https://www.surveymonkey.de/r/PY37292