Logo Mathepedia Mathepedia auf Facebook
Wurzelzieher Blog
 

Zufallsvariablen


Standardabweichung

Die Standardabweichung ist in der Stochastik ein Maß für die Streuung der Werte einer Zufallsvariablen um ihren Mittelwert. Sie ist für eine Zufallsvariable \(\displaystyle X\) definiert als die positive Quadratwurzel aus deren Varianz und wird als \(\displaystyle \sigma_x = \sqrt{\operatorname{Var}(X)}\) notiert. Die Varianz einer Zufallsvariable ist das zentrierte Moment zweiter Ordnung der zugehörigen Verteilung, der Erwartungswert das erste Moment.

Liegt eine Beobachtungsreihe \(\displaystyle (x_1, x_2, \dots, x_N)\) der Länge \(\displaystyle N \) vor, so sind empirischer Mittelwert und empirische Standardabweichung die zwei wichtigsten Maßzahlen in der Statistik zur Beschreibung der Eigenschaften der Beobachtungsreihe.

Als Abkürzung findet man neben \(\displaystyle \sigma\) in Anwendungen insbesondere für die empirische Standardabweichung oft auch \(\displaystyle \bm{s}\), sowie m.F. für mittlerer Fehler. In der angewandten Statistik findet man häufig die Kurzschreibweise der Art "Ø 21 ± 4", was als "Mittelwert 21 und Standardabweichung 4" zu lesen ist.

 
 

Ein Beispiel (mit Schwankungsbreite)

Mittleres Alter (beispielsweise in einer Tanzschule) = (17,5 ± 1,2) Jahre. Beide Werte zusammen ergeben die mittlere Schwankungsbreite, MW ± s = 16,3 bis 18,7 Jahre.

Sie gilt im Falle normalverteilter Mengen (siehe Glockenkurve) mit einer Wahrscheinlichkeit von ca. 68 % (jene von 2\(\displaystyle \sigma\) mit ca. 95 %). Demnach lässt obige Schwankungsbreite erwarten, dass

  • 16 % der Tanzschüler jünger als 16,3 Jahre sind (und 2 - 3 % unter 15,1 Jahre) und
  • 16 % älter als 18,7 Jahre (und 2 - 3 % über 19,9 Jahre) sind.

Dieses Beispiel hat jedoch kaum Normalverteilung, denn es sind vermutlich von den Kursteilnehmern mehr als 2,5 % älter als 20 Jahre.

  • Faustregeln für die Praxis sind: Werte außerhalb der zwei- bis dreifachen Standardabweichung werden oft als Ausreißer behandelt. Ausreißer können ein Hinweis auf grobe Fehler der Datenerfassung sein. Es kann den Daten aber auch eine stark schiefe Verteilung zu Grunde liegen. Andererseits muss ca. jeder 20ste Messwert außerhalb der zweifachen Standardabweichung liegen.

Mathematische Definition der Standardabweichung

Die Standardabweichung einer Zufallsvariablen \(\displaystyle X\) ist mathematisch definiert als die Quadratwurzel einer anderen Streuungsmaßzahl, der Varianz:

\(\displaystyle \sigma_X := \sqrt{E\braceNT{(X-E\braceNT{X})^2}} \) Die Standardabweichung hat gegenüber der Varianz den Vorteil, dass sie die gleiche Einheit hat wie die ursprünglichen Messwerte.
Wenn die Zahl der Kinder in einem Haushalt untersucht wird, so ist die Einheit der Varianz ein Quadratkind, die Einheit der Standardabweichung aber wieder ein Kind.

Schätzung der Standardabweichung aus einer Stichprobe

Sind die \(\displaystyle x_i\) unabhängig identisch verteilte Zufallsvariablen, also beispielsweise eine Stichprobe, so wird die Standardabweichung der Grundgesamtheit häufig mit der Formel

\(\displaystyle s_X := \sqrt{\dfrac{1}{N-1} \sum\limits_{i=1}^N{(x_i-\bar{x})^2}} \)

geschätzt.

Dabei ist

  • \(\displaystyle s_X\) der Schätzer für die Standardabweichung \(\displaystyle \sigma_X\) der Grundgesamtheit
  • \(\displaystyle N\) der Stichprobenumfang (Anzahl der Werte bzw. Anzahl der Freiheitsgrade)
  • \(\displaystyle x_i\) die Merkmalsausprägungen am \(\displaystyle i\)-ten Element der Stichprobe
  • \(\displaystyle \bar{x}= \dfrac{1}{N} \sum\limits_{i=1}^N{x_i}\) der empirische Mittelwert, also das arithmetische Mittel der Stichprobe.

Diese Formel erklärt sich daraus, dass die Stichprobenvarianz

\(\displaystyle s_X^2 := \dfrac{1}{N-1} \sum\limits_{i=1}^N{(x_i-\bar{x})^2}\)

ein erwartungstreuer Schätzer für die Varianz \(\displaystyle \sigma_X^2\) der Grundgesamtheit ist. \(\displaystyle s_X\) ist aber kein erwartungstreuer Schätzer für die Standardabweichung, denn da die Quadratwurzel eine konkave Funktion ist folgt aus der Jensenschen Ungleichung

\(\displaystyle Es_X = E\sqrt {s^2_X} \leq \sqrt{E\braceNT{s^2_x}} = \sigma_X\),

dieser Schätzer unterschätzt also die Standardabweichung der Grundgesamtheit.

Für den Fall normalverteilter Zufallsgrößen lässt sich allerdings ein erwartungstreuer Schätzer angeben.

\(\displaystyle \hat{\sigma} = \sqrt{\dfrac{n-1}{2}} \ \dfrac{\Gamma\braceNT{\dfrac{n-1}{2}}} {\Gamma\braceNT{\dfrac{n}{2}}} \ s_X \)

Dabei ist

  • \(\displaystyle \hat{\sigma}\) die erwartungstreue Schätzung der Standardabweichung und
  • \(\displaystyle \Gamma(x)\) die Gammafunktion.

Beispiel

Es wurden bei einer Stichprobe die fünf Werte 3, 4, 5, 6, 7 gemessen. Man soll nun die Schätzung für die Standardabweichung errechnen.

Der Korrekturfaktor ist in diesem Fall

\(\displaystyle \sqrt{2} \ \dfrac{\Gamma\braceNT{2}}{\Gamma\braceNT{2{,}5}} \approx 1{,}063846 \)

und die erwartungstreue Schätzung für die Standardabweichung ist damit näherungsweise 1,064.

Korrekturfaktoren für die erwartungstreue Schätzung der Standardabweichung
Stichprobenumfang Korrekturfaktor
2 1,253314
5 1,063846
10 1,028109
15 1,018002

Faustformel

Zur schnellen Schätzung von \(\displaystyle \sigma\) sucht man jenes Sechstel der Werte, die am kleinsten beziehungsweise am größten sind. Die Standardabweichung ist dann die halbe Differenz der beiden Grenzwerte.

Maximum-Likelihood-Schätzung für die Standardabweichung einer Normalverteilung

Die eindimensionale Normalverteilung kann unter anderem so dargestellt werden, dass die Standardabweichung ein Parameter der Verteilung ist. Bei dieser Schätzung kann die Eigenschaft der Maximum-Likelihood-Schätzung genutzt werden, dass eine monotone Transformation einer Maximum-Likelihood-Schätzung eine Maximum-Likelihood-Schätzung für die monotone Transformation des geschätzten Parameters ist. Das bedeutet, dass die Quadratwurzel einer Maximum-Likelihood-Schätzung eines Parameters, der nur positiv sein kann, eine Maximum-Likelihood-Schätzung für die Quadratwurzel dieses Parameters ist.

\(\displaystyle \hat{\sigma}_{\rm ML} = \sqrt {\dfrac{1}{n} \sum\limits_{i=1}^n{(X_i-\bar{X})^2}} \)

Diese Schätzung ist eine Maximum-Likelihood-Schätzung für einen Parameter der Normalverteilung oder für eine Transformation dieses Parameters. Sie ist nicht auf die Schätzung der Standardabweichung einer beliebigen Verteilung zu übertragen.

Die Maximum-Likelihood-Schätzung für die Standardabweichung einer Poisson-Verteilung ist beispielsweise die Quadratwurzel aus dem arithmetischen Mittel.

Als Maximum-Likelihood-Schätzung für die Standardabweichung aus der Stichprobe {3, 4, 5, 6, 7} erhält man also

\(\displaystyle \hat{\sigma}_{\rm ML} = \sqrt {\dfrac{1}{5} \cdot 10} = \sqrt{2} \approx 1{,}414 \)

unter der Voraussetzung, dass wir \(\displaystyle \bar{X}\) schätzen mit

\(\displaystyle \bar{X}=\dfrac{1}{n}\sum\limits_{i=1}^n{X_i} \)

Beispiele

Das aus der Varianz bekannte Würfelbeispiel hier für die Standardabweichung:

Die Standardabweichung beim 500-maligen Würfeln und der Zufallsgröße \(\displaystyle X\): Anzahl der Einsen

\(\displaystyle \sqrt{ 500 \cdot \over{1 }{ 6} \cdot \over{5 }{ 6}} \)

Berechnung für auflaufende Messwerte

In Systemen, die kontinuierlich große Mengen an Messwerten erfassen, ist es oft unpraktisch, alle Messwerte zwischenzuspeichern, um die Standardabweichung zu berechnen.

In diesem Zusammenhang ist es günstiger, eine modifizierte Formel zu verwenden, die den kritischen Term \(\displaystyle \sum\limits_{i=1}^N{(x_i-\bar{x})^2}\) umgeht. Dieser kann nicht für jeden Messwert sofort berechnet werden, da der Mittelwert \(\displaystyle \bar{x}\) nicht konstant ist.

Durch Anwendung des Verschiebungssatzes und der Definition des Mittelwerts \(\displaystyle \bar{x} = \sum\limits_{i=1}^N \dfrac{x_i}{N}\) gelangt man zur Darstellung

\(\displaystyle s_X = \sqrt{\dfrac{N \cdot \sum\limits_{i=1}^N{x_i^2}-\braceNT{\sum\limits_{i=1}^N{x_i}}^2}{N \cdot (N-1)}} \)

die sich für jeden eintreffenden Messwert sofort aktualisieren lässt, wenn die Summe der Messwerte \(\displaystyle \sum\limits_{i=1}^N{x_i}\) sowie die Summe ihrer Quadrate \(\displaystyle \sum\limits_{i=1}^N{x_i^2}\) mitgeführt und fortlaufend aktualisiert werden.

Siehe auch:

  • Tabelle mathematischer Symbole
  • relative Standardabweichung
  • Standardfehler

Strukturen sind die Waffen der Mathematiker.

N. Bourbaki

Copyright- und Lizenzinformationen: Diese Seite basiert dem Artikel Standardabweichung aus der frеiеn Enzyklοpädιe Wιkιpеdιa und stеht unter der Dοppellizеnz GNU-Lιzenz für freie Dokumentation und Crеative Commons CC-BY-SA 3.0 Unportеd (Kurzfassung). In der Wιkιpеdιa ist eine Listе dеr Autorеn des Originalartikels verfügbar. Da der Artikel geändert wurde, reicht die Angabe dieser Liste für eine lizenzkonforme Weiternutzung nicht aus!
Anbieterkеnnzeichnung: Wurzelzieher Mathеpеdιa  •  Тhοmas Stеιnfеld  • Dοrfplatz 25  •  17237 Blankеnsее  • Tel.: 01734332309 (Vodafone/D2)  •  Email: cο@maτhepedιa.dе
 
G: 31.01.2015 12:47:48 (499 ms; 205 M)
C: 03.03.2015 19:42:06 (0 ms; 318 M)