# Kapitel 2: Statistische Datenanalyse I – Wahrscheinlichkeiten (Teil 3)

## Fortpflanzung von Unsicherheiten

In Messungen physikalischen Größen kommt es häufig, dass die Messgröße nicht gleichzeitig die Ergebnisgröße ist. Soll beispielsweise die kinetische Energie $E_\mathsf{kin}=\frac{1}{2}mv^2$ eines gleichförmig geradlinig bewegten Objekts bestimmt werden, so könnte seine Masse $m$ mit mit einer Waage und seine Geschwindigkeit $v$ über die Zeitdauer vermessen werden, in der eine bestimmte Strecke zurückgelegt wird. Die Messungen von Masse, Zeit und Strecke sind jeweils mit statistischen Unsicherheiten behaftet. Gesucht ist ein systematisches Verfahren, um aus den als bekannt vorausgesetzten Unsicherheiten auf Masse, Zeit und Strecke die statistische Unsicherheit von $E_\mathsf{kin}$ zu bestimmen. Die zur Schätzung der Unsicherheit eingesetzten Methoden sind unter dem Namen **"(gaußsche) Fehlerfortpflanzung"** (engl.: (Gaussian) error propatation) bekannt. Eigentlich wäre der Begriff "Fortpflanzung von Unsicherheiten" (engl.: uncertainty propagation) geeigneter, dieser ist aber in der Literatur (noch) nicht etabliert. 

>**Geschichte der Fehlerfortpflanzung**: Die Frage, wie sich Unsicherheiten von Zufallsvariablen $\mathbf{x}=(x_1, \dots, x_n)^T$ auf Funktionen von Zufallsvariablen $f(\mathsf{x})$ auswirken, wurde in Europa zuerst Anfang des 17. Jahrhunderts im Zusammenhang mit der **Landvermessung** wichtig. Willebrord Snellius hat dafür die Methode der **Triangulation** eingeführt, bei der Abstände von Punkte auf der Landkarte mithilfe von Winkeln im Dreieck berechnet werden. Die Abstands- und Winkelmessungen sind mit Unsicherheiten verbunden, die sich auf das Ergebnis auf der Landkarte auswirken. Carl Friedrich Gauß hat diese Unsicherheiten zum erstem Mal systematisch bei der Landvermessung berücksichtigt. Die gaußsche Triangulation im Königreich Hannover war auf dem 10-DM-Schein unten rechts auf der Rückseite abgebildet (Quelle: Deutsche Bundesbank, gemeinfrei):

><img src="https://www.bundesbank.de/resource/blob/646492/3c8a72e907d40c7ae662ed4a4f17951c/mL/0010-1999-rs-data.jpg" width=70%>


### Lineares Fehlerfortpflanzungsgesetz
Im folgenden soll das weit verbreitete lineare Fehlerfortpflanzungsgesetz hergeleitet werden. Gegeben ist ein einem Vektor vom Zufallsvariablen $\mathbf{x}$ und gesucht ist die Unsicherheit einer Funktion dieser Zufallsvariablen $f(\mathbf{x})$. Die Unsicherheiten werden jeweils durch die Varianzen der Größen bzw. deren Standardabweichungen quantifiziert. Die Fortpflanzung der Unsicherheiten ist **exakt**, wenn $f(\mathbf{x})$ eine lineare Funktion der Zufallsvariablen $\mathbf{x}$ ist – daher der Name lineares Fehlerfortpflanzungsgesetz, ansonsten muss eine Näherung gemacht werden.

Um das Prinzip der Fortpflanzung von Unsicherheiten einzuführen soll zuerst der einfachste exakt lösbare Fall behandelt werden: Eine Zufallsvariable $u$ ist gegeben als Linearkombination zweier Zufallsvariablen $x_1$ und $x_2$ mit bekannten Varianzen $\mathsf{V}[x_i]\equiv\sigma_i^2$ und Kovarianz $\mathsf{Cov}(x_1,x_2) \equiv \sigma_{12} \equiv \rho_{12}\sigma_1\sigma_2 $.
$$
u = a_1 x_1 + a_2 x_2.
$$
Wir nutzten die Linearität des Operators $\mathsf{E}[u]$ für den Erwartungswert von $u$ aus:
$$
\mathsf{E}[u] = a_1 \mathsf{E}[x_1] + a_2 \mathsf{E}[x_2].
$$
Die Varianz von $u$ ergibt sich dann als
$$
\begin{split}
\mathsf{V}[u] 
&= \mathsf{E}[u^2] - \mathsf{E}[u]^2 \\
&= \mathsf{E}[a_1^2 x_1^2 + a_2^2 x_2^2 + 2 a_1 a_2 x_1 x_2] - 
\left( a_1 \mathsf{E}[x_1] + a_2 \mathsf{E}[x_2] \right)^2\\
&= a_1^2\, \mathsf{E}[x_1^2] + a_2^2\, \mathsf{E}[x_2^2] + 2 a_1 a_2 \mathsf{E}[x_1\cdot x_2] 
- a_1^2 \,\mathsf{E}[x_1]^2 - a_2^2 \,\mathsf{E}[x_2]^2 - 2 a_1 a_2 \,\mathsf{E}[x_1] \mathsf{E}[x_2]  .
\end{split}
$$
Durch Umsortierung der Terme lässt sich erkennen, dass diese Gleichung die Varianzen und Kovarianzen von $x_1$ und $x_2$ beinhalten:
$$
\mathsf{V}[u] = 
a_1^2 \,\mathsf{V}[x_1] + a_2^2 \,\mathsf{V}[x_2] + 2\, a_1 a_2 \,\mathsf{Cov}(x_1,x_2) = 
a_1^2 \,\sigma_1^2 + a_2^2\, \sigma_2^2 + 2 a_1 a_2\, \sigma_{12}.
$$
Die Varianzen und Kovarianzen von $x_1$ und $x_2$ werden also addiert, mit unterschiedlichen Potenzen von $a_1$ und $a_2$ gewichtet. Für eine Summe oder Differenz zweier unkorrelierter Zufallsvariablen, also $a_1=\pm 1, a_2=\pm 1, \sigma_{12}=0$, ergibt sich einfach die Summe der Varianzen
$$
\mathsf{V}[u] = \mathsf{V}[x_1] + \mathsf{V}[x_2] 
$$
und damit werden die Standardabweichungen von $x_1$ und $x_2$ "quadratisch addiert":
$$
\sigma_u = \sqrt{ \sigma_1^2 + \sigma_2^2 }.
$$
Eine wichtige Einsicht aus dieser Rechnung ist, dass sich Unsicherheiten unabhängiger Zufallsvariable nicht einfach addieren, da sie gleich wahrscheinlich in dieselbe und in unterschiedliche Richtungen fluktuieren können. Wenn $x_1$ und $x_2$ 100% korreliert sind, also $\sigma_{12}=\sigma_1 \sigma_2$, dann ist
$$
\sigma_u = \sqrt{ \sigma_1^2 + \sigma_2^2 + 2\,\sigma_2\sigma_2 } = \sigma_1 + \sigma_2.
$$
und damit werden die Standardabweichungen linear addiert, was in der Literatur manchmal als "Größtfehlerabschätzung" bezeichnet wird und nur für 100% korrelierte Zufallsvariable (was manchmal bei systematischen Unsicherheiten der Fall ist) gerechtfertigt ist. Diese Überlegungen lassen sich leicht auf Linearkombinationen von mehr als zwei Zufallsvariablen verallgemeinern.

### Unsicherheiten bei nichtlinearen Kombinationen von Zufallsvariablen
Im nächsten Schritt soll die notwendige Näherung für die Fortpflanzung von Unsicherheiten bei **nichtlineare Funktionen** von Zufallsvariablen erläutert werden. Dies geschieht anhand einer differenzierbaren Funktion $u=f(x)$ einer einzigen Zufallsvariablen $x$. Zur Bestimmung der Unsicherheit von $u$ wird die Funktion $f(x)$ um den Erwartungswert der Verteilung von $x$, $\mathsf{E}[x]\equiv \mu$, in eine Taylorreihe bis zum linearen Glied entwickelt:
$$
u = f(x) = f(\mu) + \left.\frac{\mathsf{d}f(x)}{\mathsf{d}x}\right|_{x=\mu} (x-\mu) + \dots
$$
Für dieser Näherung werden jetzt wieder Erwartungswert und Varianz berechnet. Für den Erwartungswert wird die lineare Näherung von $f(x)$ berücksichtigt und die Linearität des Erwartungswerts sowie $E[x-\mu]=0$ verwendet:
$$
\mathsf{E}[u]=\mathsf{E}[f(x)]\approx f(\mathsf{E}[x]) = f(\mu).
$$
Für die Berechnung der Varianz mit dem Verschiebungssatz wird zusätzlich noch $\mathsf{E}[u^2]$ benötigt. In der linearen Näherung von $f(x)$ ergibt sich dafür
$$
\begin{split}
\mathsf{E}[u^2] &\approx 
\mathsf{E}\left[\left(f(\mu)+ \left.\frac{\mathsf{d}f(x)}{\mathsf{d}x}\right|_{x=\mu} (x-\mu)\right)^2\right] \\
&=\mathsf{E}[f(\mu)^2] + 
2\, \mathsf{E}\left[ f(\mu)\cdot\left.\frac{\mathsf{d}f(x)}{\mathsf{d}x}\right|_{x=\mu} (x-\mu)\right] +
\mathsf{E}\left[\left( \left.\frac{\mathsf{d}f(x)}{\mathsf{d}x}\right|_{x=\mu}\right)^2(x-\mu)^2\right].
\end{split}
$$
Der zweite Term des letzten Ausdrucks verschwindet wegen $E[x-\mu]=0$ und der letzte Term entspricht einer Konstanten (der Ableitung zum Quadrat ausgewertet bei $\mu$) mal der Varianz von $x$:
$$
\mathsf{E}[u^2]\approx 
f(\mu)^2 + \left(\left.\frac{\mathsf{d}f(x)}{\mathsf{d}x}\right|_{x=\mu}\right)^2\mathsf{V}[x].
$$
Damit ergibt sich für die Varianz von $u$ in linearer Näherung:
$$\mathsf{V}[u]=
\mathsf{E}[u^2]-\mathsf{E}[u]^2 \approx 
\left(\left.\frac{\mathsf{d}f(x)}{\mathsf{d}x}\right|_{x=\mu}\right)^2 \mathsf{V}[x].
$$
Die Varianz einer beliebigen differenzierbahren Funktion einer Zufallsvariablen $x$ ist also in dieser Näherung gegeben durch die Varianz von $x$, gewichtet mit der Ableitung von $f(x)$ nach $x$, ausgewertet am Erwartungswert von $x$, zum Quadrat.

Im letzten Schritt soll jetzt der allgemeine Fall einer beliebigen differenzierbaren Funktion eines Vektors von $n$ Zufallsvariablen, $u=f(\mathbf{x})$, behandelt werden. Die Funktion wird wieder bis zum linearen Glied in eine Taylorreihe entwickelt:
$$
u=f(\mathbf{x}) = f(\boldsymbol{\mu})+
\sum\limits_{i=1}^n \left.\frac{\partial f(\mathbf{x})}{\partial x_i}\right|_{x_i=\mu_i} (x_i-\mu_i) + \dots
$$
Im folgenden vereinfachen wir die Notation und setzen
$$
\left.\frac{\partial f(\mathbf{x})}{\partial x_i}\right|_{x_i=\mu_i} \equiv \frac{\partial f}{\partial x_i}.
$$
Der Erwartungswert ist in dieser Näherung
$$
\mathsf{E}[u] \approx  f(\boldsymbol{\mu}).
$$
Für die Varianz wird außerdem benötigt:
$$
\begin{split}
\mathsf{E}[u^2] 
&\approx \mathsf{E}\left[\left(f(\mu)+ \left.\frac{\mathsf{d}f(x)}{\mathsf{d}x}\right|_{x=\mu} (x-\mu)\right)^2\right] \\
&=\mathsf{E}[f(\mu)^2] +
2 \,\mathsf{E}\left[ f(\mu)\cdot\left.\frac{\mathsf{d}f(x)}{\mathsf{d}x}\right|_{x=\mu} (x-\mu)\right] +
\mathsf{E}\left[\left( \left.\frac{\mathsf{d}f(x)}{\mathsf{d}x}\right|_{x=\mu}\right)^2(x-\mu)^2\right].
\end{split}
$$
Wie im obigen Beispiel mit einer Zufallsvariablen verschwindet der Mischterm, daher wird er hier gar nicht aufgeführt. Im letzten Term können die partiellen Ableitungen ausgewertet am Minimum als Konstanten wieder vor den Erwartungswert gezogen werden, und es verbleibt das Element der Kovarianzmatrix $V_{ij}$:
$$
\begin{split}
\mathsf{E}[u^2] 
&\approx\mathsf{E}[f(\boldsymbol{\mu})^2] +
\sum\limits_i \sum\limits_j \frac{\partial f}{\partial x_i}\cdot\frac{\partial f}{\partial x_j}
\mathsf{E}\left[ (x_i-\mu_i)(x_j-\mu_j) \right] \\
&=\mathsf{E}[f(\boldsymbol{\mu})^2] +
\sum\limits_i\sum\limits_j \frac{\partial f}{\partial x_i}\frac{\partial f}{\partial x_j}
V_{ij}.
\end{split}
$$

>Damit ergibt sich das **lineare Fehlerfortpflanzungsgesetz** für die Varianz von $u=f(\mathbf{x})$:
>$$
\mathsf{V}[u] = \sigma_u^2 \approx \sum\limits_i\sum\limits_j 
\frac{\partial f}{\partial x_i}\frac{\partial f}{\partial x_j} V_{ij} =
\sum_i \left(\frac{\partial f}{\partial x_i}\right)_{x_i=\mu_i}^2\sigma_i^2 +
2 \sum_i \sum_{j>i} 
\left.\frac{\partial f}{\partial x_i}\right|_{x_i=\mu_i} 
\left.\frac{\partial f}{\partial x_j}\right|_{x_j=\mu_j}
\sigma_{ij}.
>$$
Dabei wurde im zweiten Schritt die Doppelsumme über alle $i$ und $j$ zerlegt in Terme mit $i=j$ und Terme mit $j>i$ (mit einem Faktor 2, um die identischen Partnerterme für $j<i$ zu berücksichtigen). Damit sind die Varianzen der $x_i$ (erster Term) und Kovarianzen unterschiedlicher $x_i$ und $x_j$ (zweiter Term) separat aufgeführt.

>**Bemerkung**: An den Gleichungen des linearen Fehlerfortpflanzungsgesetzes lässt sich ablesen, wann es auch für nichtlineare Funktionen $u=f(\mathbf{x})$ eine gute Näherung darstellt: Die Funktion muss in guter Näherung **in der Nähe des Messwerts $\boldsymbol{\mu}$ linear** sein.

### "Kochrezepte" für das physikalische Praktikum
Im physikalischen Praktikum wurde in der Vergangenheit oft eine "naive Fehlerfortpflanzung" durchgeführt, die annimmt, dass das lineare Fehlerfortpflanzungsgesetz anwendbar ist und die Messgrößen unkorreliert sind. Falls Ihnen diese Situation begegnen sollte, sollten Sie auf jeden Fall den Ansatz "linear und unkorreliert" kritisch hinterfragen. Für die "naive" Fortpflanzung von Unsicherheiten
$$
\sigma_u^2 = \sum_i \left(\frac{\partial f}{\partial x_i}\right)_{x_i=\mu_i}^2\sigma_i^2 
$$
können aus dem Fehlerfortpflanzungsgesetz einfache "Kochrezepte" zur Berechnung von Unsicherheiten abgeleitet werden. Dabei wird immer der (unbekannte) Erwartungswert $\mu_i$ durch den Messwert $\hat\mu_i$ und die (unbekannte) Standardabweichung $\sigma_i$ durch die Standardunsicherheit des Messwerts $\sigma_{\hat\mu_i}$ ersetzt.

1. Für Summen und Differenzen von Messgrößen werden die absoluten Unsicherheiten quadratisch addiert:
$$
\begin{split}
u &=x_1\pm x_2 \\
\left(\frac{\partial u}{\partial x_1}\right)^2 &= \left(\frac{\partial u}{\partial x_2}\right)^2 = 1 \\
\to\quad\sigma_u^2 &= \sigma_1^2 + \sigma_2^2.
\end{split}
$$
2. Für Produkte und Quotienten von Messgrößen werden die relativen Unsicherheiten $\sigma_{x_i}/x_i$, d. h. die Unsicherheiten normiert auf den Wert selbst, quadratisch addiert (hier für Produkte gezeigt)
$$
\begin{split}
u &= x_1\cdot x_2  \\
\left(\frac{\partial u}{\partial x_1}\right)^2 &= x_2^2, \quad
\left(\frac{\partial u}{\partial x_2}\right)^2 = x_1^2 \\
\to\quad\sigma_u^2 &= x_2^2 \sigma_1^2 + x_1^2\sigma_2^2 \\
\to\quad\left(\frac{\sigma_u}{u}\right)^2 &= \left(\frac{\sigma_1}{x_1}\right)^2 + \left(\frac{\sigma_2}{x_2}\right)^2.
\end{split}
$$
Dieser Ausdruck kann für beliebige Potenzen von Messgrößen verallgemeinter werden:
$$
\begin{split}
u &=x_1^a \cdot x_2^b \\
\left(\frac{\partial u}{\partial x_1}\right)^2 &= a^2 (x_1^{a-1} x_2^b)^2,\quad
\left(\frac{\partial u}{\partial x_2}\right)^2 = b^2 (x_1^a x_2^{b-1})^2\\
\to\quad
\left(\frac{\sigma_u}{u}\right)^2 &= a^2 \left(\frac{\sigma_1}{x_1}\right)^2 + b^2\left(\frac{\sigma_2}{x_2}\right)^2. 
\end{split}
$$
Hier werden die relativen Unsicherheiten addiert, gewichtet mit dem Quadrat des Exponenten (und daher gleich für positive und negative Exponenten).

Beide "Kochrezepte" können einfach um Terme für korrelierte Messgrößen ergänzt werden:
$$
\begin{split}
u =x_1\pm x_2 \quad &\to\quad
\sigma_u^2 = \sigma_1^2 + \sigma_2^2 \pm 2\,\mathsf{Cov}(x_1,x_2)\\
u = x_1\cdot x_2,\quad u = \frac{x_1}{x_2}  \quad &\to\quad
\left(\frac{\sigma_u}{u}\right)^2 =
\left(\frac{\sigma_1}{x_1}\right)^2 + \left(\frac{\sigma_2}{x_2}\right)^2
\pm 2\, \frac{\mathsf{Cov}(x_1,x_2)}{x_1 x_2}.
\end{split}
$$

#### Python-Werkzeuge zur Fortpflanzung von Unsicherheiten
In Python gibt es Bibliotheken, die unsicherheitsbehaftete Größen behandeln und die Unsicherheiten korrekt fortpflanzen können, inklusiver einer korrekten Behandlung von Korrelationen zwischen den Größen. Hier wird das Paket [uncertainties](https://uncertainties-python-package.readthedocs.io/en/latest/index.html#) kurz anhand kleiner Beispiele vorgestellt. Nachdem Sie verstanden haben, wie Unsicherheiten fortgepflanzt werden können, dürfen Sie dieses oder andere Pakete zur Fortpflanzung von Unsicherheiten gern im physikalischen Praktikum verwenden, wenn es nicht explizit anders verlangt wird.

In [None]:
"""Example of using the 'uncertainties' package to propagate uncertainties"""
from uncertainties import ufloat, ufloat_fromstr, umath, unumpy, correlation_matrix, correlated_values

# define a variable x with a nominal value of 2 and a standard deviation of 0.25 and tag with name and unit
x = ufloat( 2, 0.25, "x (m)" )

# these variables can also be generated using strings, e.g. with short-hand notation
y = ufloat_fromstr( "-1.0(5)", "y (m)")

# print tag, nominal value and standard deviation
print( "Variable tag, value, std:", y.tag, y.nominal_value, y.std_dev )

# functions of x and y
print( "Simple functions of two variables:", x+y, x-y,x**2/y )

# print breakdown of individual uncertainty components
z = umath.cos( 0.2*x**2 + y )

# pretty print
print( "Uncertainty breakdown: z = cos( 0.2x^2 + y) = {:2eP}".format(z) )
for var,err in z.error_components().items():
    print( "  ", var.tag, var, err )

# correlation matrix: x and y uncorrelated, z correlated with both
print( "Correlation matrix of of x, y, z:\n", correlation_matrix( [ x, y, z ] ) )

# create and short-hand print correlated variables with their covariance matrix
val = [ 1, 2, 3 ]
cov = [ [  0.25,  0.10, -0.30 ],
        [  0.10,  1.00,  0.75 ],
        [ -0.30,  0.75,  4.00 ] ]
(a,b,c) = correlated_values( val, cov )
print( "Sum of correlated values: {:+.2uS}".format( a+b+c ) )

# create NumPy array of values and calculate and LaTeX print sum and mean
arr = unumpy.uarray( [2,-1], [0.25,0.5] )
print( "Sum and mean of array: {:L} {:L}".format(arr.sum(), arr.mean()) )

Mit obigen Gleichungen zur Fortpflanzung von Unsicherheiten lassen sich neben einfachen "Kochrezepten" einige wichtige Erkenntnisse über die korrekte Auswertung von Messdaten gewinnen. Diese werden im folgenden anhand einiger Beispiele erläutert.

#### Beispiel 1: Unsicherheit des Mittelwerts
Das arithmetische Mittel von $N$ unabhängigen zufälligen Messwerten aus derselben Wahrscheinlichkeitsverteilung ist selbst eine Zufallsvariable und eine lineare Funktion der Messwerte:
$$
\hat \mu = \frac{1}{N} \sum\limits_{i=1}^{N} x_i.
$$
Die Varianz dieser Funktion der Messwerte ergibt sich also exakt aus dem linearen Fehlerfortpflanzungsgessetz. Mit den partiellen Ableitungen
$$
\frac{\partial \hat\mu}{\partial x_i} = \frac{1}{N}\quad \forall i=1\dots N
$$
erhalten wir
$$
\sigma_{\hat\mu}^2 = \sum\limits_{i=1}^{N} \left(\frac{1}{N}\right)^2 \sigma_i^2.
$$
Da die Messwerte aus derselben Wahrscheinlichkeitsverteilung stammen, sind auch ihre Varianzen gleich: $\sigma_i = \sigma_x$. Damit ergibt die Summe
$$
\sigma_{\hat\mu}^2 =  \left(\frac{1}{N}\right)^2 \sum\limits_{i=1}^{N} \sigma_x^2 = \left(\frac{1}{N}\right)^2 N\sigma_x^2 = \frac{\sigma_x^2}{N}.
$$
Die Unsicherheit des arithmetischen Mittels, ausgedrückt durch die Standardabweichung, ist also um einen Faktor $1/\sqrt{N}$ kleiner als die Unsicherheit der Einzelmessung. Dieses Resultat haben wir am Anfang des Kapitels ebenfalls durch Berechnung der Varianz des Schätzwerts für den Messwert bekommen. 

Der Unterschied zwischen Unsicherheit der Einzelmessung und Unsicherheit des Mittelwerts wird in folgendem Codebeispiel illustriert, in dem 1000 Mal eine Stichprobe von $N=9$ Werten aus einer Standardnormalverteilung gezogen wird und die Streuung der Mittelwerte (rechts) mit der Streuung aller Werte (links) verglichen wird. Wie erwartet, ist die Streuung der Mittelwerte nur $1/\sqrt{N}=1/3$ so groß wie die Streuung aller Werte.

In [None]:
"""Python code demonstrating statistical uncertaintly of the mean value"""
import numpy as np
import matplotlib.pyplot as plt

# simulation n series of N measurements each
n, N = 1000, 9

# initialize random number generator and draw from normal distribution
rng = np.random.default_rng( 42 )
x = rng.normal( size=(n,N) )

# flatten array of random numbers to look at full distribution
x_all =  x.flatten()

# distribution of mean values of n distributions of N measurements (projection to axis 1)
x_grp = np.mean( x, axis=1 )

# plot the results
fig, ax = plt.subplots(1,2,figsize=([15,5]) )
bins = np.linspace( -5, 5, 51 )
ax[0].hist( x_all, bins=bins, label=r"$\hat\mu=$%5.3f, $\hat\sigma_x=$%5.3f" % ( np.mean( x_all ), np.std( x_all, ddof=1 ) ) )
ax[0].set_xlabel( "$x$")
ax[0].set_ylabel( "Frequency")
ax[0].legend()

ax[1].hist( x_grp, bins=bins, label=r"$\hat\mu=$%5.3f, $\sigma_{\hat\mu}=$%5.3f" % ( np.mean( x_grp ), np.std( x_grp, ddof=1 ) ) )
ax[1].set_xlabel( "$x$")
ax[1].set_ylabel( "Frequency")
ax[1].legend()

plt.show()

#### Beispiel 2: Unsicherheit einer Effizienz

Wie schon bei der Vorstellung der Binomialverteilung diskutiert, ist in Naturwissenschaften und Technik die **Effizienz** (engl.: efficiency) eine wesentliche Kennzahl, die aus Daten geschätzt, also gemessen werden muss, selbstverständlich inklusive Unsicherheit. Um einen Schätzwert für die Effizienz $\varepsilon = p$ ($p$: Erfolgswahrscheinlichkeit) zu erhalten, wird gezählt, wie viele Erfolge $N_p$ und wie viele Misserfolge $N_n$ es in $N$ Versuchen gibt – die Wahrscheinlichkeiten folgen einer **Binomialverteilung**. Mit der Schätzung von $\varepsilon$ bekommen wir gleichzeitig einen Schätzwert für die unbekannte Erfolgswahrscheinlichkeit $p$ und die ebenfalls unbekannte Wahrscheinlichkeit für Misserfolg $n=1-p$. Aus den Messdaten wird wie folgt ein Schätzwert $\hat\varepsilon$ für die Effizienz gewonnen: 
$$
\hat\varepsilon = \frac{N_p}{N_p+N_n}= \frac{N_p}{N} = 1 - \frac{N_n}{N}.
$$
Die einzelnen $N_p$ und $N_n$ sind unabhängig und (für "große" Werte von $N_p$ und $N_n$) poissonverteilt. Damit sind ihre Varianzen gegeben durch
$$
\sigma_{N_p}^2 = N\cdot p, \quad \sigma_{N_n}^2 = N\cdot n.
$$
Der Schätzwert für die Varianzen ergibt sich, wenn wir die Schätzwerte für $p$ und $n$ einsetzen:
$$
\hat\sigma_{N_p}^2 = N\cdot \frac{N_p}{N} = N_p, \quad \hat\sigma_{N_n}^2 = N\cdot \frac{N_n}{N} = N_n.
$$
Die Unsicherheit auf die Effizienz wird dann über lineare Fortpflanzung der Unsicherheiten mit $N_p$ und $N_n$ gewonnen:
Die partiellen Ableitungen lauten
$$
\begin{split}
\frac{\partial \hat\varepsilon}{\partial N_p} &= \frac{(N_p+N_n)-N_p}{(N_p+N_n)^2} = \frac{N_n}{N^2} = \frac{1-\hat\varepsilon}{N},\\
\frac{\partial \hat\varepsilon}{\partial N_n} &= -\frac{\hat\varepsilon}{N}
\end{split}
$$
und damit unter Verwendung von $N_p = \hat\varepsilon N$ und $N_n= (1-\hat\varepsilon) N$
$$
\begin{split}
\hat\sigma_\varepsilon^2 
&= \left(\frac{\partial \hat\varepsilon}{\partial N_p}\right)^2\cdot\sigma_{N_p}^2 +
\left(\frac{\partial \hat\varepsilon}{\partial N_n}\right)^2\cdot\sigma_{N_n}^2 \\
&= \frac{(1-\hat\varepsilon)^2}{N^2}\cdot N_p +
\frac{\hat\varepsilon^2}{N^2}\cdot N_n \\
&= \frac{1}{N}\left[ (1-\hat\varepsilon)^2 \cdot \hat\varepsilon + \hat\varepsilon^2(1-\hat\varepsilon) \right]\\
&= \frac{\hat\varepsilon(1-\hat\varepsilon)(1-\hat\varepsilon+\hat\varepsilon)}{N}\\
&= \frac{\hat\varepsilon(1-\hat\varepsilon)}{N}.
\end{split}
$$
Wenn zum Beispiel in einem Corona-Schnelltest 95 von 100 Infizierten positiv getestet werden, dann beträgt $\hat\varepsilon=0.95$ und $\hat\sigma_\varepsilon\approx 0.02$.

Dieses Ergebnis ist in Übereinstimmung mit den Erwartungen mit der Varianz der Binomialverteilung. Wir haben bei der Herleitung berücksichtigt, dass die Erfolge $N_p$ eine Untermenge aller $N$ Versuche sind. Damit sind $N_p$ und $N$ nicht unabhängig! Eine naive Fehlerfortpflanzung mit dem Quotienten $N_p/N$ hätte daher zum *falschen* Ergebnis geführt. Eine saubere Definition der Unsicherheiten für $\varepsilon \to 0$ und $\varepsilon \to 1$, wo obige Unsicherheiten verschwinden, ist komplizierter – googlen Sie nach [Clopper-Pearson-Intervallen](https://de.wikipedia.org/wiki/Konfidenzintervall_für_die_Erfolgswahrscheinlichkeit_der_Binomialverteilung#Clopper-Pearson-Intervall), wenn Sie neugierig sind, wie das geht.

#### Beispiel 3: Verhältnis zweier Zufallsvariablen
In diesem Beispiel gezeigt werden, wie für das Verhältnis zweier Zufallsvariablen das lineare Fehlerfortpflanzungsgesetz unter bestimmten Bedingungen *keine* gute Näherung darstellt. Das Verhältnis zweier normalverteilter Zufallsvariablen ist dann entgegen der der gängigen Erwartung **nicht normalverteilt**, sondern folgt einer [**Quotientenverteilung** (engl.)](https://en.wikipedia.org/wiki/Ratio_distribution). Dadurch kann die Schätzung von Erwartungswert und Standardabweichung verzerrt sein. Aus der linearen Fehlerfortpflanzung erhalten wir
$$
u = \frac{x_1}{x_2} \quad\to\quad
\left(\frac{\sigma_u}{u}\right)^2 = 
\left(\frac{\sigma_1}{x_1}\right)^2 +
\left(\frac{\sigma_2}{x_2}\right)^2.
$$
Für $\mathsf{E}[x_1] = \mathsf{E}[x_2] = 5$ und $\sigma_1 = \sigma_2 = 1$ erwarten wir $u=1$ und $\sigma_u = \sqrt{2}/5\approx 0.283$. Diese Erwartung können wir mit Zufallszahlen aus dem Computer überprüfen, in dem wir $N=1000$ Paare von normalverteilten Zufallszahlen mit obigen Parametern generieren und deren Quotienten auftragen, siehe Beispielcode. Am Ergebnis ist direkt zu sehen, dass $u$ nicht normalverteilt ist. In Wirklichkeit folgen Quotienten von Zufallsvariablen einer [Quotientenverteilung](https://en.wikipedia.org/wiki/Ratio_distribution#Uncorrelated_noncentral_normal_ratio). Wenn $x_i$ aus einer Standardnormalverteilung stammen, ist dies eine Cauchyverteilung (siehe Abschnitt über Wahrscheinlichkeitsverteilungen). Wenn wir aus dieser Verteilung arithmetisches Mittel und Stichprobenstandardabweichung bestimmen, sind sie im Vergleich zur Erwartung aus der Fehlerfortpflanzung größer und leicht verschoben. In diesem Fall wären also die Bestimmung der Unsicherheiten aus Zufallszahlen zuverlässiger. 

>**Bemerkung**
>
>Zufallszahlen stellen ein legitimes Verfahren dar, Unsicherheiten zu schätzen. Dieses Verfahren, das häufig als "Pseudoexperimente", "Ensembletest" oder "Toy-Monte-Carlo-Methode" bezeichnet wird, werden wir in Kapitel 4 noch einmal kurz aufgreifen.

In [None]:
"""Example of ratios of random numbers from normal distribution"""
import numpy as np
import matplotlib.pyplot as plt

# initialize random numbers
rng = np.random.default_rng( 42 )

# draw 1000 pairs of randon number and their ratio
N = 1000
mu, sigma = 5, 1
x1 = rng.normal(loc=mu, scale=sigma, size=N)
x2 = rng.normal(loc=mu, scale=sigma, size=N)
r = x2/x1

# plot the results
fig, ax = plt.subplots()
bins = np.linspace( -1, 3, 40 )
ax.hist( r, bins=bins, label=r"$\hat\mu=$%5.3f, $\hat\sigma_x=$%5.3f" % ( np.mean( r ), np.std( r, ddof=1 ) ) )
ax.set_xlabel( "$x$" )
ax.set_ylabel( "Frequency")
ax.legend()

plt.show()

#### Beispiel 4: Differenzen (korrelierter) Zufallsvariablen
Wir betrachten noch einmal die Paare von Zufallsvariablen aus Beispiel 3 mit $\mathsf{E}[x_1] = \mathsf{E}[x_2] = 5$ und $\sigma_1 = \sigma_2 = 1$ und bilden diesmal deren Differenz:
$$
u = x_1 - x_2.
$$
Es kann gezeigt werden, dass die Zufallsvariable $u$ einer [Skellam-Verteilung (engl.)](https://en.wikipedia.org/wiki/Skellam_distribution) folgt. Hier betrachten wir nur Erwartungswert und Standardabweichung:
$$
\mathsf{E}[u]= 0,\,
\mathsf{\sigma_u} = \sqrt{\sigma_1^2 + \sigma_2^2 - 2\mathsf{Cov}(x_1,x_2)} = \sqrt{2}\sqrt{1-\mathsf{Cov}(x_1,x_2)}
$$
Wir erlauben also eine Korrelation zwischen den Zufallsvariablen. Aus der Gleichung kann abgelesen werden, dass für $\mathsf{Cov}(x_1,x_2)=\rho_{12}\,\sigma_1\sigma_2=1$, also für 100% korrelierte Zufallsvariablen, die Unsicherheit auf $u$ sogar verschwindet. Diese Tatsache wird in der elektrischen Signalübertragung genutzt, indem ein Signal und das invertierte Signal über zwei benachbarte Leitungen geschickt wird. Korrelierte Störungen betreffen beide Leitungen und beide Signale gleichermaßen und sind deswegen im Differenzsignal nicht zu sehen (oder zumindest stark reduziert). Dies wird als symmetrische oder **differenzielle Signalübertragung** (engl.: differential signaling) bezeichnet und kommt sowohl in der Tontechnik (XLR-Kabel) als auch in schneller Elektronik (USB, Ethernet, LVDS = low voltage differential signaling) zum Einsatz. In folgender Schemazeichnung ist das Konzept illustriert (Quelle: Patagonier, [Signals_fulsym.svg](https://upload.wikimedia.org/wikipedia/commons/9/9b/Signals_fulsym.svg), [CC BY-SA 4.0](https://creativecommons.org/licenses/by-sa/4.0/deed.en)):

<img src="https://upload.wikimedia.org/wikipedia/commons/9/9b/Signals_fulsym.svg">

Das folgende Codebeispiel illustriert den Einfluss der Korrelation auf die Unsicherheit. Dazu werden aus einer bivariaten Normalverteilung mit nichtdiagonaler Kovarianzmatrix Paare von korrelierten Zufallszahlen gezogen und die Verteilung ihrer Differenz aufgetragen. Mit Vergrößerung des Korrelationskoeffizienten $\rho_{12}$ wird die Streuung der Differenz kleiner, bis sie für $\rho_{12}\to 1$ verschwindet.

In [None]:
"""illustrate influence of correlations on uncertainty of difference of two random numbers"""
import numpy as np
import matplotlib.pyplot as plt

# simulate N pairs of random numbers
N = 1000
mu = np.array( [ 5.0, 5.0 ] )
rho12, sigma1, sigma2  = 0.5, 1.0, 1.0
cov = np.array( [[ sigma1**2, rho12*sigma1*sigma2 ],
                 [ rho12*sigma1*sigma2, sigma2**2] ] )

rng = np.random.default_rng( 42 )
x = rng.multivariate_normal( mu, cov, size=N )
diff =  x[:,0] - x[:,1]

# plot
fig, ax = plt.subplots( 1, 2, figsize=([15,7]) )

ax[0].scatter( x[:,0], x[:,1] )
ax[0].set_xlim( 0, 10 )
ax[0].set_ylim( 0, 10 )
ax[0].set_xlabel( "$x_1$" )
ax[0].set_ylabel( "$x_2$" )

bins = np.linspace( -5, 5, 51 )
ax[1].hist( diff, bins=bins, label=r"$\hat\mu=$%5.3f, $\hat\sigma_x=$%5.3f" % ( np.mean( diff ), np.std( diff, ddof=1 ) ) )
ax[1].set_xlabel( "$u = x_1 - x_2$" )
ax[1].set_ylabel( "Frequency" )
ax[1].legend()

plt.show()