Verteilungsfunktion

Die Verteilungsfunktion ist eine spezielle reelle Funktion in der Stochastik und ein zentrales Konzept bei der Untersuchung von Wahrscheinlichkeitsverteilungen auf den reellen Zahlen. Jeder Wahrscheinlichkeitsverteilung und jeder reellwertigen Zufallsvariable kann eine Verteilungsfunktion zugeordnet werden. Anschaulich entspricht dabei der Wert der Verteilungsfunktion an der Stelle $x$ der Wahrscheinlichkeit, dass die zugehörige Zufallsvariable $X$ einen Wert kleiner oder gleich $x$ annimmt. Ist beispielsweise die Verteilung der Schuhgrößen in Europa gegeben, so entspricht der Wert der entsprechenden Verteilungsfunktion bei 45 der Wahrscheinlichkeit, dass ein beliebiger Europäer die Schuhgröße 45 oder kleiner besitzt.

Ihre Bedeutung erhält die Verteilungsfunktion durch den Korrespondenzsatz, der besagt, dass jeder Verteilungsfunktion eine Wahrscheinlichkeitsverteilung auf den reellen Zahlen zugeordnet werden kann und umgekehrt. Die Zuordnung ist bijektiv. Dies ermöglicht es, anstelle der Untersuchung von Wahrscheinlichkeitsverteilungen als Mengenfunktionen auf einem komplexen Mengensystem mit Methoden der Maßtheorie die entsprechenden Verteilungsfunktionen zu untersuchen. Diese sind reelle Funktionen und somit über die Methoden der reellen Analysis leichter zugänglich.

Als alternative Bezeichnungen finden sich unter anderem kumulierte Verteilungsfunktion bzw. kumulative Verteilungsfunktion, da sie die Wahrscheinlichkeiten, kleiner als $x$ zu sein, anhäuft (siehe auch kumulierte Häufigkeit). Weiterhin wird sie zur besseren Abgrenzung von ihrem höherdimensionalen Pendant, der multivariaten Verteilungsfunktion, auch als univariate Verteilungsfunktion bezeichnet.^[1] In Abgrenzung zum allgemeineren maßtheoretischen Konzept einer Verteilungsfunktion finden sich die Bezeichnungen als wahrscheinlichkeitstheoretische Verteilungsfunktion oder als Verteilungsfunktion im engeren Sinn.^[2]

Die Entsprechung der Verteilungsfunktion in der deskriptiven Statistik ist die empirische Verteilungs- oder Summenhäufigkeitsfunktion.

Definition

Definition mittels Wahrscheinlichkeitsmaß

Gegeben sei ein Wahrscheinlichkeitsmaß $P$ auf dem Ereignisraum der reellen Zahlen, d. h., jede reelle Zahl kann als mögliches Ergebnis aufgefasst werden. Dann heißt die Funktion

F_{P}\colon \mathbb {R} \to [0,1]

definiert durch:

F_{P}(x)=P((-\infty ,x])

die Verteilungsfunktion von $P$ . Mit anderen Worten: Die Funktion gibt an der Stelle $x$ an, mit welcher Wahrscheinlichkeit ein Ergebnis aus der Menge $(-\infty ,x]$ (alle reellen Zahlen kleiner oder gleich $x$ ) eintritt.

Definition mittels Zufallsvariable

Ist $X$ eine reelle Zufallsvariable, so nennt man die Funktion

F_{X}(x)=P(X\leq x)

die Verteilungsfunktion von $X$ . Dabei bezeichnet $P(X\leq x)$ die Wahrscheinlichkeit, dass $X$ einen Wert kleiner oder gleich $x$ annimmt.

Somit ist die Verteilungsfunktion einer Zufallsvariablen genau die Verteilungsfunktion ihrer Verteilung.

Beispiele

Wahrscheinlichkeitsmaße mit Dichten

Besitzt das Wahrscheinlichkeitsmaß $P$ eine Wahrscheinlichkeitsdichte $f_{P}$ , so gilt

P((a,b])=\int _{a}^{b}f_{P}(x)\,\mathrm {d} x

.

Somit hat in diesem Fall die Verteilungsfunktion die Darstellung

F_{P}(x)=\int _{-\infty }^{x}f_{P}(t)\,\mathrm {d} t

.

Beispielsweise hat die Exponentialverteilung die Dichte

f_{\lambda }(x)={\begin{cases}\displaystyle \lambda {\rm {e}}^{-\lambda x}&x\geq 0\\0&x<0\end{cases}}

.

Ist also die Zufallsvariable $X$ exponentialverteilt, also $X\sim \operatorname {Exp} (\lambda )$ , so ist

F_{X}(x)=\int _{-\infty }^{x}f_{\lambda }(t)\,\mathrm {d} t={\begin{cases}1-\mathrm {e} ^{-\lambda x}&x\geq 0,\\0&x<0.\end{cases}}

.

Dieses Vorgehen ist jedoch nicht allgemein gangbar. Erstens besitzen nicht alle Wahrscheinlichkeitsmaße auf den reellen Zahlen eine Dichtefunktion (beispielsweise diskrete Verteilungen, aufgefasst als Verteilungen in $\mathbb {R}$ ); zweitens muss selbst bei der Existenz einer Dichtefunktion nicht notwendigerweise eine Stammfunktion mit geschlossener Darstellung existieren (so beispielsweise bei der Normalverteilung).

Diskrete Wahrscheinlichkeitsmaße

Betrachtet man zu einem Parameter $p\in (0,1)$ eine Bernoulli-verteilte Zufallsvariable $X$ , so ist

P(X=0)=1-p{\text{ und }}P(X=1)=p

und für die Verteilungsfunktion folgt dann

F_{X}(x)={\begin{cases}0&{\text{ falls }}x<0\\1-p&{\text{ falls }}0\leq x<1\\1&{\text{ falls }}x\geq 1\end{cases}}

Ist allgemeiner $X$ eine Zufallsvariable mit Werten in den nichtnegativen ganzen Zahlen $\mathbb {N} _{0}$ , dann gilt

F_{X}(x)=\sum _{k=0}^{\lfloor x\rfloor }P(X=k)

.

Dabei bezeichnet $\lfloor \cdot \rfloor$ die Abrundungsfunktion, das heißt $\lfloor x\rfloor$ ist größte ganze Zahl, die kleiner oder gleich $x$ ist.

Eigenschaften und Zusammenhang zur Verteilung

Jede Verteilungsfunktion $F\colon \mathbb {R} \rightarrow [0,1]$ hat folgende Eigenschaften:

$F$ ist monoton steigend.
$F$ ist rechtsseitig stetig.
$\lim _{x\to -\infty }F(x)=0$ und $\lim _{x\to \infty }F(x)=1$ .

Darüber hinaus ist jede Funktion $F\colon \mathbb {R} \rightarrow [0,1]$ , die die Eigenschaften 1, 2 und 3 erfüllt, eine Verteilungsfunktion. Folglich ist eine Charakterisierung der Verteilungsfunktion mit Hilfe der drei Eigenschaften möglich. So gibt es zu jeder Verteilungsfunktion $F\colon \mathbb {R} \rightarrow [0,1]$ genau solch ein Wahrscheinlichkeitsmaß $P_{F}\colon {\mathcal {B}}(\mathbb {R} )\to [0,1]$ , dass für alle $x\in \mathbb {R}$ gilt:

P_{F}\left(]-\infty ,x]\right)=F(x)

Umgekehrt gibt es zu jedem Wahrscheinlichkeitsmaß $P\colon {\mathcal {B}}(\mathbb {R} )\to [0,1]$ eine Verteilungsfunktion $F_{P}\colon \mathbb {R} \rightarrow [0,1]$ derart, dass für alle $x\in \mathbb {R}$ gilt:

P\left(]-\infty ,x]\right)=F_{P}(x)

Daraus folgt die Korrespondenz von $P_{(F_{P})}=P$ und $F_{(P_{F})}=F$ . Dieser Sachverhalt wird in der Literatur auch Korrespondenzsatz genannt.^[3]

Jede Verteilungsfunktion besitzt höchstens abzählbar viele Sprungstellen.

Da jede Verteilungsfunktion rechtsstetig ist, existiert auch der rechtsseitige Grenzwert und es gilt für alle $x\in \mathbb {R}$ :

P_{F}\left(\{x\}\right)=F(x)-\lim _{\varepsilon \to 0+}F(x-\varepsilon )

Deswegen ist $F$ genau dann stetig, wenn $P(\{x\})=0$ für alle $x\in \mathbb {R}$ gilt.

Rechnen mit Verteilungsfunktionen

Ist eine Verteilungsfunktion $F$ gegeben, so kann man wie folgt die Wahrscheinlichkeiten bestimmen:

P(X\leq a)=F(a)

sowie

P(X>a)=1-F(a)

bzw.

P((-\infty ;a])=F(a)

sowie

P((a;+\infty ))=1-F(a)

.

Daraus folgt dann auch

P(a<X\leq b)=F(b)-F(a)

und

P((a;b])=F(b)-F(a)

für $a\leq b$ .

Im Allgemeinen kann hier die Art der Ungleichheitszeichen ( $<$ oder $\leq$ ) beziehungsweise die Art der Intervallgrenzen (offen, abgeschlossen, links/rechts halboffen) nicht vernachlässigt werden. Dies führt bei diskreten Wahrscheinlichkeitsverteilungen zu Fehlern, da sich dort auch auf einzelnen Punkten eine Wahrscheinlichkeit befinden kann, die dann fälschlicherweise dazugezählt oder nicht berücksichtigt wird.

Bei stetigen Wahrscheinlichkeitsverteilungen, also insbesondere auch bei solchen, die über eine Wahrscheinlichkeitsdichtefunktion definiert werden (Absolutstetige Wahrscheinlichkeitsverteilungen), führt eine Abänderung der Ungleichheitszeichen oder Intervallgrenzen nicht zu Fehlern.

Beispiel

Beim Würfeln errechnet sich die Wahrscheinlichkeit, eine Zahl zwischen 2 (exklusive) und einschließlich 5 zu würfeln, zu

P(2<X\leq 5)=F(5)-F(2)={5 \over 6}-{2 \over 6}={3 \over 6}={1 \over 2}.

Auch der Erwartungswert einer reellen Zufallsvariablen $X$ kann generell mithilfe ihrer Verteilungsfunktion $F$ bestimmt werden. Das wird durch die Skizze in der allgemeinen Definition des Erwartungswertes illustriert und lässt sich anhand der dort angegebenen allgemeingültigen Darstellung (3) von $\mathrm {E} (X)$ durchführen.

Konvergenz

Definition

Eine Folge von Verteilungsfunktionen $(F_{n})_{n\in \mathbb {N} }$ heißt schwach konvergent gegen die Verteilungsfunktion $F$ , wenn

\lim _{n\to \infty }F_{n}(x)=F(x)

gilt für alle

x\in \mathbb {R}

, an denen

F

stetig ist.^[4]

Für Verteilungsfunktionen von Zufallsvariablen finden sich auch die Bezeichnungen konvergent in Verteilung oder stochastisch konvergent.^[5]

Eigenschaften

Über die schwache Konvergenz der Verteilungsfunktionen lässt sich mit dem Satz von Helly-Bray eine Brücke zur schwachen Konvergenz von Maßen schlagen. Denn eine Folge von Wahrscheinlichkeitsmaßen ist genau dann schwach konvergent, wenn die Folge ihrer Verteilungsfunktionen schwach konvergiert. Analog ist eine Folge von Zufallsvariablen genau denn Konvergent in Verteilung, wenn die Folge ihrer Verteilungsfunktionen schwach konvergiert.

Einige Autoren nutzen diese Äquivalenz zur Definition der Konvergenz in Verteilung, da sie leichter zugänglich ist als die schwache Konvergenz der Wahrscheinlichkeitsmaße. Teilweise findet sich die Aussage des Satzes von Helly-Bray auch im Portmanteau-Theorem.

Für Verteilungsfunktionen im Sinne der Maßtheorie ist die oben angegebene Definition nicht korrekt, sondern entspricht der vagen Konvergenz von Verteilungsfunktionen (im Sinne der Maßtheorie). Diese fällt aber für Wahrscheinlichkeitsmaßen mit der schwachen Konvergenz von Verteilungsfunktionen zusammen. Die schwache Konvergenz von Verteilungsfunktionen wird von dem Lévy-Abstand metrisiert.

Klassifikation von Wahrscheinlichkeitsverteilungen über Verteilungsfunktionen

Wahrscheinlichkeitsverteilungen, deren Verteilungsfunktion stetig ist, werden stetige Wahrscheinlichkeitsverteilungen genannt. Sie lassen sich noch weiter unterteilen in

Absolutstetige Wahrscheinlichkeitsverteilungen, für die eine Wahrscheinlichkeitsdichtefunktion existiert. Typische Beispiele hierfür wäre die Normalverteilung oder die Exponentialverteilung.
Stetigsinguläre Wahrscheinlichkeitsverteilungen, die keine Wahrscheinlichkeitsdichtefunktion besitzen. Beispiel hierfür wäre die Cantor-Verteilung.

Für absolutstetige Wahrscheinlichkeitsverteilungen entspricht die Ableitung der Verteilungsfunktion der Wahrscheinlichkeitsdichtefunktion. Zwar sind auch stetigsinguläre Wahrscheinlichkeitsverteilungen fast überall differenzierbar, ihre Ableitung ist aber fast überall gleich null.

Verteilungsfunktionen von diskreten Wahrscheinlichkeitsverteilungen zeichnen sich durch ihre Sprünge zwischen den Bereichen mit konstanten Funktionswerten aus. Bei ihnen handelt es sich um Sprungfunktionen.

Alternative Definition

Linksseitig stetige Verteilungsfunktionen

Im Einflussbereich der Tradition Kolmogorows, namentlich der mathematischen Literatur des ehem. „Ostblocks“, findet sich parallel zur heute vorherrschenden „Kleiner-gleich“-Konvention der Verteilungsfunktion bis in die jüngere Vergangenheit eine weitere, die statt des Kleiner-gleich-Zeichens das Echt-kleiner-Zeichen verwendet,^[6]^[7] also

F(x)=P(X<x),\quad x\in \mathbb {R}

Bei stetigen Wahrscheinlichkeitsverteilungen stimmen beide Definitionen überein, bei diskreten Verteilungen dagegen unterscheiden sie sich darin, dass die Verteilungsfunktion im Fall der „Echt-kleiner“-Konvention an den Sprungstellen nicht rechtsseitig, sondern linksseitig stetig ist.

Beispiel

Es ergibt sich beispielsweise für die Binomialverteilung bei der heute üblichen „Kleiner-gleich“-Konvention eine Verteilungsfunktion der Form

F(x)=P(X\leq x)=\sum _{k=0}^{\lfloor x\rfloor }{n \choose k}p^{k}(1-p)^{n-k}

,

bei der „Echt-kleiner“-Konvention dagegen die Schreibweise

F(x)=P(X<x)=\sum _{k=0}^{\lceil x-1\rceil }{n \choose k}p^{k}(1-p)^{n-k}

.

Speziell für $m\in \mathbb {N}$ gilt im zweiten Fall also^[8]

F(m)=\sum _{k=0}^{m-1}P(X=k)

.

Literatur

Klaus D. Schmidt: Maß und Wahrscheinlichkeit. 2., durchgesehene Auflage. Springer-Verlag, Heidelberg / Dordrecht / London / New York 2011, ISBN 978-3-642-21025-9, doi:10.1007/978-3-642-21026-6.
Achim Klenke: Wahrscheinlichkeitstheorie. 3. Auflage. Springer-Verlag, Berlin / Heidelberg 2013, ISBN 978-3-642-36017-6, doi:10.1007/978-3-642-36018-3.
Norbert Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. Eine Einführung. 2., überarbeitete und erweiterte Auflage. Springer-Verlag, Berlin / Heidelberg 2014, ISBN 978-3-642-45386-1, doi:10.1007/978-3-642-45387-8.

Einzelnachweise

↑ Schmidt: Maß- und Wahrscheinlichkeit. 2011, S. 246.
↑ Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. 2014, S. 62.
↑ N. Schmitz: Vorlesungen über Wahrscheinlichkeitstheorie. Teubner, 1996.
↑ Schmidt: Maß- und Wahrscheinlichkeit. 2011, S. 396.
↑ Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. 2014, S. 287.
↑ Alexandr Alexejewitsch Borowkow: Rachunek prawdopodobieństwa. Państwowe Wydawnictwo Naukowe, Warszawa 1977, S. 36 ff.
↑ Marek Fisz: Wahrscheinlichkeitsrechnung und mathematische Statistik. VEB Deutscher Verlag der Wissenschaften, Elfte Auflage, Berlin 1989, Definition 2.2.1, S. 51.
↑ W. Gellert, H. Küstner, M. Hellwich, H. Kästner (Hrsg.): Kleine Enzyklopädie Mathematik. VEB Verlag Enzyklopädie Leipzig 1970, OCLC 174754758, S. 659–660.

[1] Schmidt: Maß- und Wahrscheinlichkeit. 2011, S. 246.

[2] Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. 2014, S. 62.

[3] N. Schmitz: Vorlesungen über Wahrscheinlichkeitstheorie. Teubner, 1996.

[4] Schmidt: Maß- und Wahrscheinlichkeit. 2011, S. 396.

[5] Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. 2014, S. 287.

[6] Alexandr Alexejewitsch Borowkow: Rachunek prawdopodobieństwa. Państwowe Wydawnictwo Naukowe, Warszawa 1977, S. 36 ff.

[7] Marek Fisz: Wahrscheinlichkeitsrechnung und mathematische Statistik. VEB Deutscher Verlag der Wissenschaften, Elfte Auflage, Berlin 1989, Definition 2.2.1, S. 51.

[8] W. Gellert, H. Küstner, M. Hellwich, H. Kästner (Hrsg.): Kleine Enzyklopädie Mathematik. VEB Verlag Enzyklopädie Leipzig 1970, OCLC 174754758, S. 659–660.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Verteilungsfunktion

Inhaltsverzeichnis

Definition