Diskussion:Stichprobenverteilung

Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 45 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind. Das aktuelle Archiv befindet sich unter Archiv.

Auslagerung[Quelltext bearbeiten]

Letzter Kommentar: vor 15 Tagen2 Kommentare2 Personen sind an der Diskussion beteiligt

Dieser Artikel dient der Auslagerung des Abschnitts "Stichprobenverteilung" aus dem Artikel Schätzfunktion.--Sigma^2 (Diskussion) 00:41, 15. Mai 2024 (CEST)Beantworten

Dieser Abschnitt kann archiviert werden. biggerj1 (Diskussion) 20:02, 17. Mai 2024 (CEST)

--biggerj1 (Diskussion) 20:02, 17. Mai 2024 (CEST)Beantworten

Vergleich zu Bayesscher Statistik[Quelltext bearbeiten]

Letzter Kommentar: vor 9 Tagen12 Kommentare2 Personen sind an der Diskussion beteiligt

Dieser Satz „Die Stichprobenverteilung ist ein frequentistisches Konzept; das bayessche Pendant ist die A-posteriori-Verteilung.“ wurde hierher ausgelagert, das sein Inhalt völlig unverständlich ist. --Sigma^2 (Diskussion) 22:20, 15. Mai 2024 (CEST)Beantworten

Gut, dass du es erstmal rausgenommen hast. Ich denke es bedarf der Klärung. Hier Mal wie ich den Satz interpretieren würde: typische Freuqentistische Statistik, betrachtet Stichproben und leitet daraus Punktschätzer, sowie Konfidenzintervalle ab. Die Konfidenzintervalle haben typischerweise als Breite die Abstände der (geschätzten) Quantile der Dichtefunktion der. z.B. falls die Verteilungsfunktion der Schätzfunktion

{\overline {X}}

eine Normalverteilung ist, so ist das entsprechende Konfidenzintervall also

+/-1.96{\sqrt {{\hat {Var}}({\overline {X}})}}

... Soweit zur Freuqentistischen Verwendung der Stichprobenverteilung. Nun meine Interpetation zur Bayesschen Statistik: hier versucht man keinen Punktschätzer zu finden, sondern eher die Verteilung der möglichen Parameter

\mu

, welche der Stichprobe zugrunde liegen. Insofern wird die Posteriori- Dichte

p(\mu |X_{1}=x_{1},\dots X_{n}=x_{n})

der wahren Parameter

\mu

betrachtet und dein en:Credibility interval aus den Quantilen der A-posteriori-Verteilung berechnet. Macht das Sinn? Ich bin offen für Gegenargumente, würde mich aber ansonsten schon über diese Ausführungen im Artikel freuen. biggerj1 (Diskussion) 20:01, 17. Mai 2024 (CEST)Beantworten

Hier vielleicht nochmal in leicht anderen Worten: https://stats.stackexchange.com/a/167998/298651 biggerj1 (Diskussion) 22:15, 17. Mai 2024 (CEST)Beantworten

Das ist alles nicht falsch, aber z. B. hier Bayessche_Statistik#Bayessche_Inferenz_am_Beispiel_des_Münzwurfes wird die Rolle der Stichprobenverteilung sehr klar (Formeln von dort übernommen):

{\underset {\text{Posterior}}{\underbrace {\Pr(\mu \mid m,N)} }}\propto {\underset {\text{Likelihood}}{\underbrace {\Pr(m\mid \mu ,N)} }}{\underset {\text{Prior}}{\underbrace {\Pr(\mu )} }}

Der Faktor Likelihood ist der beobachtete Wert der Wahrscheinlichkeitsfunktion

\Pr(m\mid \mu ,N)=\mathrm {Binom} (m\mid \mu ,N)={\binom {N}{m}}\mu ^{m}(1-\mu )^{N-m}

einer Binomialverteilung mit den Parametern

\mu

und

N

. Diese Binomialverteilung ist die Stichprobenverteilung der Summenvariablen

M=\sum _{i=1}^{N}X_{i},

die aus

N

stochastisch unabhängigen, Bernoulli-verteilten Stichprobenvariablen

X_{i}\sim \mathrm {Ber} (\mu )

für

i=1,\dots ,n

gebildet ist.

m

im Faktor Likelihood ist ein realisierter und beobachteter Wert der Zufallsvariablen

M

.

Die Stichprobenverteilung ist also kein "Pendant" (im Sinn von Entsprechung, Äquivalent) sondern bei der bayesianische Inferenz geradezu das orthogonale Komplement der A-Priori-Verteilung. Die Kombination der Stichprobenverteilung einer Stichprobenfunktion und der A-Priori-Verteilung auf dem Parameterraum zur Erzeugung der A-Posteriori-Verteilung auf dem Parameterraum ist der Kern der bayesianischen Inferenz. Deswegen meine hartes "inhaltlich völlig unverständlich" zum entnommenen Satz, der eine unsinnige Parallelität zwischen Stichprobenverteilung und A-Priori-Verteilung suggeriert. (Im übrigen ist der Artikel Bayessche Statistik nicht gut, mit vager unstatistischer Notation und Begrifflichkeit, wahrscheinlich in wesentlichen Teilen von Nichtstatistikern, vermutlich Philosophen, konzipiert und geschrieben.) --Sigma^2 (Diskussion) 11:05, 18. Mai 2024 (CEST)Beantworten

Mein erster Gedanke ist: nicht jeder Schätzer ist ein Maximum-Likelihood Schätzer. Falls wir einen Schätzer betrachten, der nicht durch die Likelihood-Funktion hergeleitet wird, so hat die Verteilung dieses Schätzers doch nichts mit der Likelihood der einzelnen Beobachtungen zu tun. In diesem Fall tritt die Verteilung der Schätzfunktion doch nicht als Likelihood-Funktion auf. Oder übersehe ich etwas. Falls ja, würde es den Artikel wahrscheinlich gut ergänzen. Die Likelihood der Daten ist (im Allgemeinen) nicht dasselbe wie die Verteilung eines Schätzers, oder? biggerj1 (Diskussion) 19:41, 18. Mai 2024 (CEST)Beantworten

Sehe ich auch so. Im Beispiel könnte man den bayesschen Inferenzschritt – mit demselben Ergebnis! – auch mit der

N

-dimensionalen Verteilung der Stichprobe

(X_{1},\dots ,X_{N})

anstatt mit der Stichprobenverteilung der Summenvariable

M

durchführen, denn die Wahrscheinlichkeitsfunktion der Verteilung des Stichprobenvektors ist

\Pr((X_{1},\dots ,X_{N})=(x_{1},\dots ,x_{N}))=\mu ^{M}(1-\mu )^{N-M},\quad (x_{1},\dots ,x_{N})\in \{0,1\}^{n}

und unterscheidet sich daher nur durch einen Proportionalitätsfaktor von der Binomialverteilung. Die tieferliegende Ursache ist die Suffizienz der Stichprobenfunktion

M

(zum obigen Beispiel vgl. Suffiziente_Statistik#Beispiel:_Binomialverteilung). Suffizienz und Likelihoodfunktion sind Berührungspunkte der klassischen (Fisherianischen) und der bayesianischen Statistik. Einer Schätzfunktion für den Parameter

\mu

einer Bernoulliverteilung (das obige Beispiel), die sich weder im Sinn der klassischen Inferenz, noch im Sinn der bayesschen Infernz, noch entscheidungstheoretisch rechtfertigen lässt, würde ich nicht über den Weg trauen und denke, dass ich sie nicht der wissenschaftlichen Statistik zuordnen würde.

Hast Du ein Beispiel für einen Schätzer, der "nichts mit der Likelihood der einzelnen Beobachtungen zu tun hat"? Ein solcher Schätzer hätte auch nichts mit der Wahrscheinlichkeitsverteilung der Beobachtungen (das ist ja nur eine unterschiedliche Sichtweise auf dasselbe Objekt, im Beispiel

\Pr(m;N,\mu )=L(\mu ;m,N)

) zu tun.

Zur letzten Frage: Die Likelihood der Daten ist ein realisierter Wert der Wahrscheinlichkeitsfunktion (im diskreten Fall) oder der Dichtefunktion (im stetigen Fall) der Verteilung der Stichprobenvariablen. Die zugehörige Verteilung ist die Wahrscheinlichkeitsverteilung des Stichprobenvektors, der Stichprobenvektor ist eine (triviale)

N

-dimensionale Stichprobenfunktion mit der sich der bayesianische Inferenzschritt durchführen läßt. Falls eine suffiziente Schätzfunktion für einen Parameter existiert, ergibt sich aus der Stichprobenverteilung der suffiziente Schätzfunktion die bis auf einen Faktor dieselbe Likelihoodfunktion. Die Likelihoodfunktion basiert praktisch immer auf der Stichprobenverteilung einer suffizienten Schätzfunktion für einen Parameter.--Sigma^2 (Diskussion) 23:18, 18. Mai 2024 (CEST)Beantworten

Es gibt es einen neuen Abschnitt Stichprobenverteilung#Bayesianische Inferenzstatistik, in dem ich versucht habe, das Wichtigste konzentriert und in statistischer Notation darzustellen. --Sigma^2 (Diskussion) 18:33, 19. Mai 2024 (CEST)Beantworten

So wie du es formuliert hast bin ich einverstanden :) soweit ich es verstehe besteht die Verbindung zwischen Stichprobenverteilung eines Schätzers und A-Posteriori-Verteilung eines Parameters in der Bayesschen Inference nur dann, wenn wir eine suffiziente Statistik (als Schätzer des Parameters) betrachten. Betrachten wir eine insuffiziente Statistik ( siehe z.B. https://math.stackexchange.com/a/146242/984376 ), bei der nicht die komplette Information einer Stichprobe genutzt wird, so hat die Stichprobenverteilung dieser insuffizienten Statistik nicht die gleiche Aussagekraft wie die Likelihood-Funktion. In diesem Fall fehlt die Verbindung zwischen der Stichprobenfunktion der insuffizienten Statistik und der A-posteriori Verteilung. Habe ich das richtig wiedergegeben? biggerj1 (Diskussion) 21:28, 19. Mai 2024 (CEST)Beantworten

Danke für deine Ausführungen oben! Das hat mir sehr beim Verständnis geholfen und dein Verweis auf did suffiziente Statistik war extrem hilfreich (ich kannte das Konzept, hätte es aber nicht hier anwenden können)! Es wäre toll, wenn du dein Wissen bezüglich der Verbindung "Stichprobenverteilung einer suffizienten Statistik" <-> "Likelihoodfunktion" auch im Artikel suffiziente Statistik einbauen könntest. Gerne mit den Beispielen oben (und eventuell einem Beispiel für eine insuffiziente Statistik). biggerj1 (Diskussion) 21:57, 19. Mai 2024 (CEST)Beantworten

Könntest du auch den Artikel Likelihood-Funktion mit deiner Erklärung als "realisierter Wert der Wahrscheinlichkeits(dichte) der Verteilung der Stichprobenvariablen" + Stichprobenvektor ... Mit Formeln erweitern ? Ich denke das wäre eine Bereicherung für den Artikel dort! --biggerj1 (Diskussion) 22:09, 19. Mai 2024 (CEST)Beantworten

Stichprobenverteilungen kommen auch noch dann in Spiel, wenn aus der A-Priori-Verteilung Schätzwerte für dem Parameter gewonnen werden, zu denen dann Schätzfunktionen und Stichprobenverteilungen gehören. Ich habe einen entsprechenden Abschnitt ergänzt. --Sigma^2 (Diskussion) 10:04, 20. Mai 2024 (CEST)Beantworten

Dieser Abschnitt kann archiviert werden. biggerj1 (Diskussion) 21:54, 23. Mai 2024 (CEST)

--biggerj1 (Diskussion) 21:54, 23. Mai 2024 (CEST)Beantworten

Anwendung Konfidenzintervall + Bayessche Erweiterung[Quelltext bearbeiten]

Letzter Kommentar: vor 13 Tagen1 Kommentar1 Person ist an der Diskussion beteiligt

Ich sehe leider keinen Abschnitt mehr, welcher die "Breite" der Stichprobenverteilung als Konstruktionsbegründung für ein Konfidenzintervall heranzieht. Für mich ist das eine wichtige Anwendung der Stichprobenverteilung. Die Bayessche Erweiterung dieser Idee ist dann das Glaubwürdigkeitsintervall welches aus der A-posteriori Verteilung berechnet wird. Könnten wir das so wieder im Artikel wiederspiegeln? biggerj1 (Diskussion) 22:19, 19. Mai 2024 (CEST)Beantworten

Beispiele[Quelltext bearbeiten]

Letzter Kommentar: vor 17 Tagen3 Kommentare1 Person ist an der Diskussion beteiligt

Der Abschnitt Stichprobenverteilung des Artikels Schätzfunktion enthielt drei Beispiele, die aus verschiedenen Gründen sehr problematisch sind und zur Diskussion hierher kopiert werden.

Beispiel 3[Quelltext bearbeiten]

Ein Lebensmittelgroßmarkt bekommt eine Lieferung von 2000 Gläsern mit Pflaumenkompott. Problematisch sind in den Früchten verbliebene Kerne. Der Kunde toleriert einen Anteil von Gläsern mit Kernen von 5 %. Er möchte sich bei dieser Lieferung vergewissern, dass diese Quote nicht überschritten wird. Eine komplette Erhebung der Grundgesamtheit von 2000 Gläsern ist allerdings nicht durchführbar, denn 2000 Gläser zu kontrollieren ist zu aufwendig und außerdem zerstört das Öffnen eines Glases die Ware.

Allerdings könnte man eine kleine Zahl von Gläsern zufällig aussuchen, also eine Stichprobe nehmen, und die Zahl der zu beanstandenden Gläser zählen. Übersteigt diese Zahl eine bestimmte Grenze, den kritischen Wert der Prüfgröße, geht man davon aus, dass auch in der Lieferung zu viele zu beanstandende Gläser sind.

Eine mögliche Stichprobenfunktion ist $\pi ={\frac {1}{n}}(X_{1}+X_{2}+\ldots +X_{n})$ , wobei $X_{i}$ eine Zufallsvariable bezeichnet, die nur die Werte 1 (Glas enthält Pflaumen mit Kern) oder 0 (Glas enthält keine Pflaumen mit Kern) annimmt.

Wenn die Zufallsvariablen $X_{i}$ Bernoulli-verteilt sind, dann ist aufgrund des zentralen Grenzwertsatzes $\pi$ approximativ normalverteilt.

Diskussion von Beispiel 3: Bei einer Zerstörung ist ein Ziehungsschema mit Zurücklegen nicht möglich. Die Stichprobenvariablen sind nicht stochastisch unabhängig, eine Berufung auf den zentralen Grenzwertsatz ist nicht möglich ( $n\to \infty$ gibt es nicht, bei $n=2000$ sind alle Gläser geöffnet). Als Beispiel für Stichprobenverteilung ungeeignet. Es ist viel komplizierter (die Summenvariable ist hypergeometrisch verteilt).--Sigma^2 (Diskussion) 23:03, 15. Mai 2024 (CEST)Beantworten

Beispiel 2[Quelltext bearbeiten]

In einer Urne sind fünf rote und vier blaue Kugeln. Es werden drei Kugeln ohne Zurücklegen aus dieser Urne gezogen. Definiert man die Stichprobenfunktion $X$ : Zahl der roten Kugeln unter den drei gezogenen, ist $X$ hypergeometrisch verteilt mit $M=5$ als Zahl der roten Kugeln in der Urne, $N=9$ als Gesamtzahl der Kugeln in der Urne und $n=3$ als Zahl der Versuche. Hier können alle Informationen über die Verteilung von $X$ gewonnen werden, weil sowohl das stochastische Modell (Ziehen aus einer Urne) als auch die zugehörigen Parameter (Anzahl der roten und blauen Kugeln) bekannt sind.

Diskussion von Beispiel 2: Das Beispiel illustriert nicht den Inhalt des Artikels. Die Beziehung zwischen den Stichprobenvariablen $(X_{1},X_{2},X_{3})$ und der Stichprobenfunktion $G$ wird durch das Beispiel nicht hergestellt. Die Notation verträgt sich nicht mit dem Artikel.--Sigma^2 (Diskussion) 23:08, 15. Mai 2024 (CEST)Beantworten

Beispiel 1[Quelltext bearbeiten]

Gegeben sei eine Urne mit sieben Kugeln mit den Aufschriften 10, 11, 11, 12, 12, 12 und 16. Wenn man zwei Kugeln mit Zurücklegen zieht, zeigt die folgende Tabelle alle möglichen Stichproben aus der Grundgesamtheit:

	10	11	11	12	12	12	16
10	10;10	10;11	10;11	10;12	10;12	10;12	10;16
11	11;10	11;11	11;11	11;12	11;12	11;12	11;16
11	11;10	11;11	11;11	11;12	11;12	11;12	11;16
12	12;10	12;11	12;11	12;12	12;12	12;12	12;16
12	12;10	12;11	12;11	12;12	12;12	12;12	12;16
12	12;10	12;11	12;11	12;12	12;12	12;12	12;16
16	16;10	16;11	16;11	16;12	16;12	16;12	16;16

Jede der möglichen Stichproben tritt mit der Wahrscheinlichkeit von $1/49$ auf. Berechnet man nun den Stichprobenmittelwert ${\overline {X}}=(X_{1}+X_{2})/2$ aus den zwei Kugeln, so ergibt sich:

${\overline {X}}$	10	11	11	12	12	12	16
10	10,0	10,5	10,5	11,0	11,0	11,0	13,0
11	10,5	11,0	11,0	11,5	11,5	11,5	13,5
11	10,5	11,0	11,0	11,5	11,5	11,5	13,5
12	11,0	11,5	11,5	12,0	12,0	12,0	14,0
12	11,0	11,5	11,5	12,0	12,0	12,0	14,0
12	11,0	11,5	11,5	12,0	12,0	12,0	14,0
16	13,0	13,5	13,5	14,0	14,0	14,0	16,0

Fasst man die Ergebnisse von ${\overline {X}}$ entsprechend der Wahrscheinlichkeit des Auftretens der Stichprobe zusammen, so erhält man die Stichprobenverteilung von ${\overline {X}}$ :

$x$	10,0	10,5	11,0	11,5	12,0	13,0	13,5	14,0	16,0
$P({\overline {X}}=x)$	1/49	4/49	10/49	12/49	9/49	2/49	4/49	6/49	1/49

Ändert man die Art der Ziehung, von einer Ziehung mit Zurücklegen in eine Ziehung ohne Zurücklegen, so ergibt sich eine andere Verteilung für ${\overline {X}}$ . In den oberen Tabellen fällt dann die Hauptdiagonale weg, sodass es nur $42$ mögliche Stichproben gibt. Daher ergibt sich dann folgende Verteilung für ${\overline {X}}$ :

$x$	10,0	10,5	11,0	11,5	12,0	13,0	13,5	14,0	16,0
$P({\overline {X}}=x)$	0	4/42	8/42	12/42	6/42	2/42	4/42	6/42	0

Diskussion von Beispiel 1: Das Beispiel illustriert nicht den Inhalt des Artikels. Die Beziehung zwischen den Stichprobenvariablen $(X_{1},X_{2},X_{3})$ und der Stichprobenfunktion $G$ wird durch das Beispiel nicht hergestellt. Ein einfacheres Beispiel, z. B. mit drei Kugeln, und einer klareren Beschriftung der Tabellen könnte helfen. --Sigma^2 (Diskussion) 23:23, 15. Mai 2024 (CEST)Beantworten

Ich halte diese Beispiele auch nicht für hilfreich

Dieser Abschnitt kann archiviert werden. biggerj1 (Diskussion) 21:52, 23. Mai 2024 (CEST)

Mögliche Erweiterungen[Quelltext bearbeiten]

Letzter Kommentar: vor 16 Tagen1 Kommentar1 Person ist an der Diskussion beteiligt

Weitere WP-Links, EN
Rolle der hypergeometrischen Verteilung beim Ziehen ohne Zurücklegen
Verwendung des Begriffs sampling distribution bereits durch Fisher vor 100 Jahren (erledigt)
Verweise auf die Stichprobenverteilungen von $\max\{X_{1},\dots ,X_{n}\}$ , $\min\{X_{1},\dots ,X_{n}\}$
Andere Approximationen der Stichprobenverteilung (Poisson-Verteilung, Extremwertverteilungen)

--Sigma^2 (Diskussion) 00:13, 17. Mai 2024 (CEST) Wenn man Stichprobenverteilungen aufnimmt, die bei Schätzfunktionen für die Varianz auftreten, müsste man die Notation überarbeiten um das Symbol $S_{n}$ freizubekommen.--Sigma^2 (Diskussion) 10:28, 18. Mai 2024 (CEST)Beantworten

Bild[Quelltext bearbeiten]

Letzter Kommentar: vor 15 Tagen5 Kommentare2 Personen sind an der Diskussion beteiligt

Es wäre sehr schön ein Beispielbild für die Stichprobenverteilung des Mittelwertschätzers ${\overline {X}}_{n}=1/n\sum _{i=1}^{n}X_{i}$ zu haben. Man könnte wunderbar zeigen, wie für 3 immer größer werdende $n$ die Stichprobenverteilung enger um den echten Mittelwert $\mu$ wird, da $Var({\overline {X}}_{n})=\sigma ^{2}/n$ (siehe Standardfehler). Wer könnte das Bild anfertigen? --biggerj1 (Diskussion) 09:34, 17. Mai 2024 (CEST)Beantworten

Ich fände so ein Bild auch gut, finde aber, dass es eindeutig in den Artikel Schätzfunktion gehört, da es ein Basisproblem der Schätztheorie ist. --Sigma^2 (Diskussion) 11:43, 17. Mai 2024 (CEST)Beantworten

Ich habe mal ein Bild eingefügt. Ich denke man könnte den Text drum herum verbessern. biggerj1 (Diskussion) 16:41, 17. Mai 2024 (CEST)Beantworten

Text angepasst.--Sigma^2 (Diskussion) 18:58, 17. Mai 2024 (CEST)Beantworten

Besten Dank! :) du kannst das Bild ja auch in anderen Artikeln an entsprechender Stelle einbinden. LG --biggerj1 (Diskussion) 19:21, 17. Mai 2024 (CEST)Beantworten

Dieser Abschnitt kann archiviert werden. --Sigma^2 (Diskussion) 18:58, 17. Mai 2024 (CEST)

Diskussion:Stichprobenverteilung

Inhaltsverzeichnis

Auslagerung[Quelltext bearbeiten]

Vergleich zu Bayesscher Statistik[Quelltext bearbeiten]

Anwendung Konfidenzintervall + Bayessche Erweiterung[Quelltext bearbeiten]