Verschiebungssatz (Statistik)

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Satz von König-Huyghens)
Zur Navigation springen Zur Suche springen

Der Verschiebungssatz (auch Satz von Steiner oder Steinerscher Verschiebungssatz genannt) beschreibt, wie sich die Eigenschaften einer Variablen oder Zufallsvariablen ändern, wenn zu dieser Variable eine Konstante addiert wird. Kurz gesagt, er besagt, dass wenn wir zu einer Variablen oder Zufallsvariablen eine Konstante hinzufügen, sich bestimmte Charakteristika der Verteilung dieser Variable ändern, aber auf vorhersagbare Weise.

Mathmatisch ausgedrückt: Wenn wir zu einer Zufallsvariablen eine Konstante addieren und diese modifizierte Variable als bezeichnen, dann ändern sich bestimmte Momente von auf vorhersagbare Weise. Die Momente von können durch eine einfache Formel berechnet werden, die die Momente von und die hinzugefügte Konstante berücksichtigt.

Der Verschiebungssatz von Steiner ist wichtig, weil er es uns ermöglicht, die Effekte von konstanten Verschiebungen auf die Verteilung von Variablen oder Zufallsvariablen zu verstehen. Diese Erkenntnis hat viele Anwendungen in der Statistik und Wahrscheinlichkeitstheorie, zum Beispiel bei der Berechnung von durchschnittlichen Werten und Varianzen von veränderten Variablen oder Zufallsvariablen.

Satz von Steiner[Bearbeiten | Quelltext bearbeiten]

Der Satz Steiner für Zufallsvariablen besagt:

Dabei ist , das te Moment der Zufallsvariablen , , das te Moment der Zufallsvariablen . ist der Binomialkoeffizient über .

Insbesondere für den Fall gilt

.

Für die Varianz einer Zufallsvariablen gilt mit , d. h. :

.

Empirische Variante[Bearbeiten | Quelltext bearbeiten]

Für die empirische Version des Satzes von Steiner für Beobachtungswerten mit müssen die theoretischen durch die empirischen Momente ersetzt werden, also bzw. und dann gilt:

Analog zu den Zufallsvariablen kann man für ableiten mit :

.

Beispiel mit n Beobachtungswerten[Bearbeiten | Quelltext bearbeiten]

Der Verschiebungssatz wird zunächst am einfachsten Fall vorgeführt: Es seien die Werte gegeben, beispielsweise eine Stichprobe. Es wird die Summe der Abweichungsquadrate dieser Werte gebildet:

wobei

das arithmetische Mittel der Zahlen ist. Der Verschiebungssatz ergibt sich aus[1]

.

Rechenbeispiel[Bearbeiten | Quelltext bearbeiten]

Im Rahmen der Qualitätssicherung werden fortlaufend Kaffeepäckchen gewogen. Für die ersten vier Päckchen erhielt man die Werte (in g)

Das durchschnittliche Gewicht beträgt

Es ist

Für die Anwendung des Verschiebungssatzes berechnet man

und

Man kann damit beispielsweise die (korrigierte) empirische Varianz als „durchschnittliches“ Abweichungsquadrat bestimmen:

im Beispiel

Kommt nun ein weiteres Päckchen in die Stichprobe, so reicht es zur Neuberechnung der Stichprobenvariation mit Hilfe des Verschiebungssatzes, lediglich die Werte für und neu zu berechnen. Beim fünften Päckchen werde das Gewicht 510 g gemessen. Dann gilt:

sowie

Die Stichprobenvarianz der neuen, größeren Stichprobe ist dann

Anwendungen[Bearbeiten | Quelltext bearbeiten]

Summe der quadratischen Abweichungen[Bearbeiten | Quelltext bearbeiten]

Für die Summe der quadratischen Abweichungen von Beobachtungswerten und deren arithmetisches Mittel gilt:

.

Damit kann man berechnen, ohne das Mittel bereits vorab zu kennen und ohne alle Stichprobenwerte speichern zu müssen.

Bei der Berechnung mit Gleitkommazahlen kann es jedoch zu einer numerischen Auslöschung kommen, wenn erheblich größer ist als die Varianz, die Daten also nicht zentriert sind.[2] Daher bietet sich die Verwendung dieser Formel primär für analytische Betrachtungen an, nicht für die Verwendung mit realen Daten. Eine mögliche Abhilfe[3] ist, vorab eine Näherung für das Mittel zu bestimmen und damit zu berechnen:

.

Falls die Näherung nahe genug an dem echten Mittel liegt, ist die Genauigkeit mit dieser Formel gut. Weitere numerisch stabilere Berechnungsmethoden finden sich in der Literatur.[3][2]

Stichprobenkovarianz[Bearbeiten | Quelltext bearbeiten]

Die Summe der Abweichungsprodukte zweier Merkmale und ist gegeben durch

Hier ergibt der Verschiebungssatz

Die korrigierte Stichprobenkovarianz berechnet sich dann als „durchschnittliches“ Abweichungsprodukt

Zufallsvariable[Bearbeiten | Quelltext bearbeiten]

Varianz[Bearbeiten | Quelltext bearbeiten]

Die Varianz einer Zufallsvariablen

lässt sich mit dem Verschiebungssatz auch angeben als[4]

Dieses Resultat wird auch als Satz von König-Huygens bezeichnet. Es ergibt sich aus der Linearität des Erwartungswertes:

Eine allgemeinere Darstellung des Verschiebungssatzes ergibt sich aus:

.
  • Man erhält bei einer diskreten Zufallsvariablen mit den Ausprägungen und der dazugehörigen Wahrscheinlichkeit dann für
Mit der speziellen Wahl ergibt sich und die obige Formel
  • Für eine stetige Zufallsvariable und der dazugehörigen Dichtefunktion ist
Man erhält hier mit dem Verschiebungssatz

Kovarianz[Bearbeiten | Quelltext bearbeiten]

Die Kovarianz zweier Zufallsvariablen und

lässt sich mit dem Verschiebungssatz als

angeben.

Für diskrete Zufallsvariablen erhält man für

entsprechend zu oben

mit als gemeinsamer Wahrscheinlichkeit, dass und ist.

Bei stetigen Zufallsvariablen ergibt sich mit als gemeinsamer Dichtefunktion von und an der Stelle und für die Kovarianz

entsprechend zu oben

Geschichte[Bearbeiten | Quelltext bearbeiten]

Es ist unklar, warum für den Verschiebungssatz selten auch die Bezeichnung Satz von Steiner benutzt wird, denn der Verschiebungssatz kann nicht in eine direkte Verbindung gebracht werden mit dem Werk des Mathematikers Jacob Steiner.

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Hans-Friedrich Eckey, Reinhold Kosfeld, Christian Dreger: Statistik: Grundlagen — Methoden — Beispiele, S. 86
  2. a b Erich Schubert, Michael Gertz: Numerically stable parallel computation of (co-)variance. In: Proceedings of the 30th International Conference on Scientific and Statistical Database Management - SSDBM '18. ACM Press, Bozen-Bolzano, Italy 2018, ISBN 978-1-4503-6505-5, S. 1–12, doi:10.1145/3221269.3223036 (acm.org [abgerufen am 7. Dezember 2019]).
  3. a b Tony F. Chan, Gene H. Golub, Randall J. LeVeque: Algorithms for computing the sample variance: analysis and recommendations. In: The American Statistician Vol. 37, No. 3 (Aug., 1983), S. 242–247
  4. Ansgar Steland: Basiswissen Statistik, S. 116