Benutzer:Sigma^2/Statistik-Seiten

Problematik der Statistik-Seiten in der Wikipedia[Bearbeiten | Quelltext bearbeiten]

Mangelhaftes Niveau der Statistik-Seiten[Bearbeiten | Quelltext bearbeiten]

Walter Krämer [abgerufen am 13.9.2021]:

„Warnung vor Wikipedia -- Zitate aus der deutschen Wikipedia sind ab jetzt in akademischen Abschlussarbeiten an meinem Institut nicht mehr erlaubt. Anders als die englische wird die deutsche Wikipedia von Ideologen dominiert. Außerdem steckt sie in vielen Artikeln zu Wirtschaftswissenschaften und Statistik voller Fehler. Generell ist das Niveau von Artikeln zur Statistik weit unterhalb einer Bachelorarbeit an unserer Fakultät.^[1]“

Die Dominanz durch Ideologen kann ich für die Statistik-Seiten nicht bestätigen. Die Aussage über das niedrige Niveau und die Fehlerhaftigkeit der Statistik-Seiten teile ich.

Ursachen[Bearbeiten | Quelltext bearbeiten]

Eine Ursache ist, dass als Quellen anstelle wissenschaftlicher statistischer Monographien häufig vereinfachende und fehlerhafte Darstellungen von Nichtstatistikern für Nichtstatistiker verwendet werden. Eine weitere Ursache ist, das Wikipedia-Autoren, die in ihrem Studium (typischerweise nicht im Fach Statistik) auch mit bestimmten Anwendungen der Statistik konfrontiert wurden, denken, dieser winzige Ausschnitt sei "die Statistik". Niemand käme in der Mathematik auf die Idee, ein Buch dass von einem Nichtmathematiker für Nichtmathematiker geschrieben wurde, als Quelle für mathematische Terminologie oder Methodik zu verwenden. Bei statistischen Anwendern ist dies eher der Regelfall. Diese Problematik tritt insbesondere bei den Statistikeinführungen für Psychologen, Pädagogen, Mediziner, Wirtschaftswissenschaftler, Soziologen, Politologen usw. auf. Der Anteil der Autoren von Statistik-Seiten, die sich längere Lebenszeit mit Statistik befasst haben, scheint verschwindend zu sein.

Einige wenige Autoren mit solidem Hintergrund in Mathematik und Stochastik haben immer wieder grobe Fehler korrigiert und dafür gesorgt, dass die Artikel im Bereich der Stochastik eine durchgängig fehlerfreieres Niveau haben. Allerdings werden solche Stochastik-Konzepte, die in der Statistik sehr wichtig sind, häufig ausschließlich im Hinblick zu ihrem Bezug zur Maßtheorie, nicht aber zur Statistik diskutiert, wodurch viele für Nichtmathematiker völlig unlesbare Artikel zur Stochastik entstanden sind.

Qualitätssicherung und "Portal Statistik"[Bearbeiten | Quelltext bearbeiten]

Es gibt das Portal:Statistik, das aber keine systematische Qualitätssicherung der Statistik-Seiten organisiert. Teilweise findet die Qualitätssicherung von statistisch-methodischen Artikeln im Portal:Mathematik/Qualitätssicherung statt.

Das Portal:Statistik wurde längere Zeit kaum noch genutzt, z B. stand der Eintrag "Aktuelles" im Jahr 2022 auf 2014.

Der Artikel Portal:Statistik/Literatur enthielt bis 2022 überwiegend elementare Einführungen, aber keine wissenschaftlichen Standardwerke zur Statistik. Ich habe in den Jahren 2022 und 2023 den Artikel Portal:Statistik/Literatur gegliedert und einige wissenschaftliche Standardwerke eingetragen.

Probleme bei den Artikeln zur Testtheorie[Bearbeiten | Quelltext bearbeiten]

Diese sind teilweise aus einem viel zu engen Blickwinkel geschrieben

Nullhypothesen werden implizit fälschlicherweise als einelementig unterstellt
Konfusion zwischen Fehlerwahrscheinlichkeit 1. Art und Signifikanz
Konfusion zwischen der Terminologie medizinischer Test, die häufig eine binäres Klassifikationsproblem sind, und statistischen Tests.
Es wird von der Fehlerwahrscheinlichkeit 1. Art und der Fehlerwahrscheinlichkeit 2. Art gesprochen, so als sei es selbstverständlich, dass alle Null- und Gegenhypothesen einelementig sind.
Unverständnis dafür, dass teilweise in den schlecht übersetzten Software-Paketen Unsinn steht oder extreme sprachliche Verkürzungen vorgenommen sind. So kann man ein vorgegebenes Signifikanzniveau auch als 'maximal zugelassene Irrtumswahrscheinlichkeit' bezeichnen. Wenn dann in einer Software-Ausgabe nur verkürzend 'Irrtumswahrscheinlichkeit' steht, heißt das nicht dass Irrtumswahrscheinlichkeit und Signifikanzniveau dasselbe ist.
Wenn in der (seriösen) Literatur die Begriffe Signifikanzniveau und Irrtumswahrscheinlichkeit zusammengebracht werden, dann mit einem Zusatz. Das Signifikanzniveau wird dann erlaubte Irrtumswahrscheinlichkeit oder zugelassene Irrtumswahrscheinlichkeit genannt, wobei zuvor klar gestellt ist, dass mit Irrtumswahrscheinlichkeiten Fehlerwahrscheinlichkeiten 1. Art gemeint sind.
Unkenntnis über den Unterschied zwischen Umfang und Macht eines Testes.

Probleme bei den Artikeln zur mathematischen Statistik[Bearbeiten | Quelltext bearbeiten]

Statistisches Modell und Parametrisierung[Bearbeiten | Quelltext bearbeiten]

In vielen Artikel wird eine unvollständige Definition eines statistischen Modells verwendet, wobei eine Menge von Wahrscheinlichkeitsverteilungen lediglich als Verteilungsfamilie ${\mathcal {P}}=(P_{\theta })_{\theta \in \Theta }$ definiert. Dieses Modell taugt nicht für die Durchführung statistischer Inferenzmethoden, da unterschiedliche Parameter dieselbe Wahrscheinlichkeitsverteilung haben können und damit nicht von Beobachtungen auf Parameter geschlossen werden kann. Der entscheidende Punkt ist die Parametrisierung, die im Zusammenhang mit der Statistik eine bijektive Abbildung zwischen ${\mathcal {P}}$ und $\Theta$ voraussetzt,^[1] während das Konzept der Familie ${\mathcal {P}}=(P_{\theta })_{\theta \in \Theta }$ nur eine Abbildung $\theta \mapsto P_{\theta }$ für alle $\theta \in \Theta$ impliziert.

↑ Hermann Witting: Mathematische Statistik I. Parametrische Verfahren bei festem Stichprobenumfang. Teubner, Stuttgart 1985, ISBN 3-519-02026-2, Kap. 1.1, S. 5.

Von dieser Problematik sind der Artikel statistischer Raum und zahlreiche Artikel betroffen, die sich auf diesen beziehen, z. B. Gleichmäßig bester Test, Gütefunktion, Maximin-Test, Neyman-Pearson-Test,Nichtrandomisierter Test, Randomisierter Test, Strenger Test.

Beispiel zu Parametrisierung versus Indizierung

$t(\nu )$ bezeichne die t-Verteilung mit $\nu \in \mathbb {N}$ Freiheitsgraden. ${\mathcal {P}}:=\{t(\nu )\mid \nu \in \mathbb {N} \}$ ist dann eine abzählbar unendliche Menge von Verteilungen. Betrachtet wird die Indexmenge $\Theta =\mathbb {N}$ und die Abbildung $P:\Theta \to {\mathcal {P}}$

P_{\theta }=P(\theta )={\begin{cases}t(1)&{\text{für }}\theta =1,3,5,\dots \\t(\theta /2)&{\text{für }}\theta =2,4,6,\dots \end{cases}}

Dann gilt ${\mathcal {P}}=\{P_{\theta }\mid \theta \in \Theta \}$ . Eine Zerlegung von $\Theta$ in zwei nichtleere disjunkte Teilmengen, z. B.

\Theta _{0}:=\{1\},\quad \Theta _{1}:=\Theta \setminus \Theta _{0}

definiert für die zugehörigen Verteilungsmengen

{\mathcal {P}}_{0}:=\{P_{\theta }\in {\mathcal {P}}\mid \theta \in \Theta _{0}\}

und

{\mathcal {P}}_{1}:=\{P_{\theta }\in {\mathcal {P}}\mid \theta \in \Theta _{1}\}

keine Zerlegung von ${\mathcal {P}}$ , da

{\mathcal {P}}_{0}=\{t(1)\},\quad {\mathcal {P}}_{1}={\mathcal {P}}

Eine Indizierung ist nicht notwendig eine injektive Abbildung, während mit einer Parametrisierung einer Verteilungsmenge eine Bijektion zwischen $P:\Theta \to {\mathcal {P}}$ , $\theta \mapsto P_{\theta }$ gemeint ist.

Statistik-Seiten mit Qualitätsmängeln[Bearbeiten | Quelltext bearbeiten]

Alphafehler-Kumulierung[Bearbeiten | Quelltext bearbeiten]

es wird über lokale, globale und multiple Niveaus geredet, ohne die Begriffe zu definieren
"konservativste Form"
Verweis auf den nicht existierenden Artikel Multiples Testproblem

Attributables Risiko[Bearbeiten | Quelltext bearbeiten]

konfuse Vermischung von relativen Häufigkeiten (aus Daten) und Wahrscheinlichkeiten

Ausfallrate[Bearbeiten | Quelltext bearbeiten]

unvollständige Definition

Bayes-Klassifikator[Bearbeiten | Quelltext bearbeiten]

Ist eingetragen im Portal:Mathematik/Qualitätssicherung
seltsame Terminologie: Feature-Vektor, Feature Vektor, Features
konfuse Vermischung von relativen Häufigkeiten (aus Daten) und Wahrscheinlichkeiten

Bayessche Statistik[Bearbeiten | Quelltext bearbeiten]

Ist eingetragen im Portal:Mathematik/Qualitätssicherung
Notation problematisch

- Das Symbol

\Pr

wird teils für die Wahrscheinlichkeit eines Ereignisse, teils für die Dichte- oder Wahrscheinlichkeitsfunktion, teils für die Wahrscheinlichkeitsverteilung verwendet.

- Außerdem wird uneinheitlich

\Pr

,

P

und

p

verwendet.

- Die Notation für die Beta-Verteilung mit Angabe des Namens der Zufallsvariablen ist unüblich (wenn nicht sogar unsinnig) und unverträglich mit dem Artikel Beta-Verteilung.

- Analoges gilt für die Notation der Binomialverteilung.

Bayessches Netz[Bearbeiten | Quelltext bearbeiten]

unerklärte und inkonsistente Schreibweise $P(X)$ (gemeint ist wohl Wahrscheinlichkeitsfunktion oder Dichtefunktion)

Bestimmtheitsmaß[Bearbeiten | Quelltext bearbeiten]

Fehlendes statistisches Modell
es bleibt völlig unklar, was ein aus den Daten berechnetes Bestimmtheitsmaß schätzt
der gesamte Artikel ist beschreibend und ohne theoretischen Hintergrund geschrieben
enthält unsinnig Behauptung über angeblich unverzerrte Schätzer von Standardabweichungen

Beurteilung eines binären Klassifikators[Bearbeiten | Quelltext bearbeiten]

Konfusion zwischen relativen Häufigkeiten und Wahrscheinlichkeiten

Effektstärke[Bearbeiten | Quelltext bearbeiten]

Unklare Begrifflichkeit: Stärke eines "statistischen Effekts"
Unklar, ob es um Unterschiede in der Grundgesamtheit oder in der Stichprobe geht
Unstatistische Argumentation
Effect size hat keinen Eintrag in EOSS
englischsprachiger Artikel en:Effect size ist erheblich besser
teilweise liegt die abstruse Vorstellung zugrunde, substanzwissenschaftliche Relevanz könne irgendwie statistisch bestimmt werden

Einstichproben-t-Test[Bearbeiten | Quelltext bearbeiten]

Phantasierte Anwendung bei nicht normalverteilter Grundgesamtheit
Falsche Interpretation der Testverteilung
Uneinheitliche Schreibweise für Quantile

Ereigniszeitanalyse[Bearbeiten | Quelltext bearbeiten]

Im stochastischen Modell wechselnder Bezug auf Individuum bzw. Population
Es fehlt ein statistisches Modell (Überlebensfunktionen der Individuen, stochastische Unabhängigkeit)

Fehler 1. und 2. Art[Bearbeiten | Quelltext bearbeiten]

es fehlen Fehlerwahrscheinlichkeiten
falsche Verwendung des Risikobegriffs
fehlerhafte Entscheidungstabelle
fehlerhafte formale Darstellung der Fehlerwahrscheinlichkeiten
falsche Wertigkeit der Terminologie aus medizinischen Labortests
Unsinn über bedingte Wahrscheinlichkeiten
Macht eines Tests fehlt
Umfang eines Tests fehlt

Globaler F-Test[Bearbeiten | Quelltext bearbeiten]

Keine Unterscheidung zwischen Zufallsvariablen und Realisationen

Gammaverteilung[Bearbeiten | Quelltext bearbeiten]

Unsinn über unterschiedliche Parametrisierungen (deutschsprachig usw.)

Gauß-Test[Bearbeiten | Quelltext bearbeiten]

Unsinnige Aussage, dass Gauß-Test nicht für kleine Stichprobengeeignet ist
Der (ungewöhnliche) Begriff "Testprüfgröße" wird uneinheitlich teils für die Teststatistik (Stichprobenvariable), teils für die Prüfgröße im Sinn einer Zahl (Realisation der Teststatistik)
Differenzentest wird falsch als Zweistichprobentest dargestellt
Beispiel schlecht

Impfstoffwirksamkeit[Bearbeiten | Quelltext bearbeiten]

konfuse Vermischung von relativen Häufigkeiten (aus Daten) und Wahrscheinlichkeiten

Inzidenz (Epidemiologie)[Bearbeiten | Quelltext bearbeiten]

konfuse Vermischung von relativen Häufigkeiten (aus Daten) und Wahrscheinlichkeiten

Kritischer Wert (Statistik)[Bearbeiten | Quelltext bearbeiten]

Notationsprobleme

Levene-Test[Bearbeiten | Quelltext bearbeiten]

fehlende Voraussetzungen
schlechte Formulierungen in Beispielen
falsche Theorie

Logistische Regression[Bearbeiten | Quelltext bearbeiten]

Notationsproblematik
Unklare Verwendung bedingter Wahrscheinlichkeiten

Logit[Bearbeiten | Quelltext bearbeiten]

Notationsprobleme

Modus (Statistik)[Bearbeiten | Quelltext bearbeiten]

Falsche Charakterisierung der deskriptiven Statistik
Verengung auf Stichproben

Multiples Testen[Bearbeiten | Quelltext bearbeiten]

irreführende Weiterleitung auf Testen allgemeiner linearer Hypothesen, dort gab es eine – inzwischen gelöschte – kurze Anmerkung zu multiplen Tests und den Verweis auf Alphafehler-Kumulierung

Multiples Testproblem[Bearbeiten | Quelltext bearbeiten]

nicht existenter Artikel, auf den aber im Artikel Statistischer Test verwiesen wird
Die in en:Multiple comparisons problem behandelte Thematik wird teilweise im Artikel Alphafehler-Kumulierung behandelt.

Post-hoc-Test[Bearbeiten | Quelltext bearbeiten]

Der Artikel klärt nicht, was ein Post-hoc-Test im Unterschied zu einem gewöhnlichen statistischen Test ist, wo der Begrirf herkommmt, wo er benutzt wird usw.

Operationscharakteristik[Bearbeiten | Quelltext bearbeiten]

Konfusion zwischen Schätzer und Schätzwert
Der "wahre" Parameter ... , "tatsächliche Lage", "wahre Lage"

Probit-Modell[Bearbeiten | Quelltext bearbeiten]

Ist eingetragen im Portal:Mathematik/Qualitätssicherung
Im Artikel wird ein Probit nicht ein einziges Mal verwendet, es wird auch nicht auf Probit verwiesen.
Notationsprobleme: Vektor der X-Variablen ist mit X bezeichnet.
Im Abschnitt Modell problematische Notation.

Nichtstochastischer versus stochastischer Regressor[Bearbeiten | Quelltext bearbeiten]

Beobachtete Werte: $(y_{i},\mathbf {x} _{i})\in \{0,1\}\times \mathbb {R} ^{p}$ für $i=1,\dots ,n$

Nichtstochastische Regressoren:: Die $y_{i}$ sind realisierte Werte von stochastisch unabhängigen Bernoulli-verteilten Zufallsvariablen, deren Verteilungen von $\mathbf {x} _{i}$ abhängen,

P(Y_{i}=1)=\Phi (\beta _{0}+{\boldsymbol {\beta }}'\mathbf {x} _{i}),\quad P(Y_{i}=0)=1-P(Y_{i}=1)

mit unbekannten Parametern $\beta _{0}\in \mathbb {R}$ und ${\boldsymbol {\beta }}\in \mathbb {R} ^{p}$ .

Stochastische Regressoren:: Die $(y_{i},\mathbf {x} _{i})$ sind realisierte Werte von stochastisch unabhängigen und identisch verteilten Zufallsvektoren $(Y_{i},\mathbf {X} _{i})$ , wobei die $Y_{i}$ Bernoulli-verteilt sind und die bedingten Verteilungen von $Y_{i}$ gegeben $\mathbf {X} _{i}=\mathbf {x} _{i}$ durch

P(Y_{i}=1\mid \mathbf {X} _{i}=\mathbf {x} _{i})=\Phi (\beta _{0}+{\boldsymbol {\beta }}'\mathbf {x} _{i}),\quad P(Y_{i}=0\mid \mathbf {X} _{i}=\mathbf {x} _{i})=1-P(Y_{i}=1\mid \mathbf {X} _{i}=\mathbf {x} _{i})

mit unbekannten Parametern $\beta _{0}\in \mathbb {R}$ und ${\boldsymbol {\beta }}\in \mathbb {R} ^{p}$ spezifiziert sind.

Die beiden statistischen Modell führen zu derselben Likelihoodfunktion für gegebene beobachtete Werte $(y_{i},\mathbf {x} _{i})$ ,

L(\beta _{0},{\boldsymbol {\beta }})=\prod _{i=1}^{n}\Phi (\beta _{0}+{\boldsymbol {\beta }}'\mathbf {x} _{i})^{y_{i}}(1-\Phi (\beta _{0}+{\boldsymbol {\beta }}'\mathbf {x} _{i}))^{1-y_{i}}

.

Probitfunktion[Bearbeiten | Quelltext bearbeiten]

Der Zusammenhang $p=\Phi (\beta _{0}+{\boldsymbol {\beta }}'\mathbf {x} _{i})$ für $0<p<1$ ist unter Verwendung der Probit-Funktion ${\text{probit}}$ äquivalent zu

{\text{probit}}(p)=\beta _{0}+{\boldsymbol {\beta }}'\mathbf {x} _{i}\;.

Regressionsanalyse[Bearbeiten | Quelltext bearbeiten]

Keine Unterscheidung zwischen Modellebene und Ebene der Daten und der entsprechenden Fragestellungen: Schätzung eines Modells für die Grundgesamtheit, Anpassung einer Regression an die Daten

Regressionsparameter[Bearbeiten | Quelltext bearbeiten]

konfuse Vermischung von stochastischen mit nichtstochastischen Regressoren
falsche Verwendung des Konzeptes der Standardisierung
unscharfe Notation (keine Unterscheidung zwischen Zufallsvariablen und Realisationen)
unerklärte Notation, unvollständige Formeln

Relative und absolute Risikoreduktion[Bearbeiten | Quelltext bearbeiten]

konfuse Vermischung von relativen Häufigkeiten (aus Daten) und Wahrscheinlichkeiten

Relatives Risiko[Bearbeiten | Quelltext bearbeiten]

konfuse Vermischung von relativen Häufigkeiten (aus Daten) und Wahrscheinlichkeiten

Repräsentativität[Bearbeiten | Quelltext bearbeiten]

stark überarbeitungsbedürftig
Problematik des Begriffs unterrepräsentiert

ROC-Kurve[Bearbeiten | Quelltext bearbeiten]

keine Definition
keine Unterscheidung zwischen theoretischer ROC-Kurve und empirischer ROC-Kurve

Run-Test[Bearbeiten | Quelltext bearbeiten]

Richtiger Name Iterationstest
konfuse Vermischung verschiedener Test (Test auf Zufälligkeit, Wald-Wolfowitz-Test auf Gleichheit von zwei Grundgesamtheiten)

Statistischer Test[Bearbeiten | Quelltext bearbeiten]

problematische Schreibweisen und Notation für Ablehnwahrscheinlichkeit
problematische Schreibweise für Binomialwahrscheinlichkeit, die als Binomialverteilung bezeichnet wird
falsche Behauptung über Umfang eines Tests
Tabelle enthält mehrere problematische Behauptungen, Empfehlungen und falsche Voraussetzungen
zweidimensionale Beobachtungen werden als "zwei abhängige Stichproben" bezeichnet
falscher Verweis auf einen nichtexistenten Hauptartikel Multiples Testen
Weblink [Statistical Tests Overview] ist toter Link
Weblink "Statistische Versuchsauswertung" ist toter Link

Statistisches Modell[Bearbeiten | Quelltext bearbeiten]

Es fehlt das Wesentliche eines parametrischen Modells: die Identifizierbarkeit der Parameter bzw. die eindeutige Identifizierbarkeit einer Verteilung durch den Parameter

Stichprobenraum[Bearbeiten | Quelltext bearbeiten]

Artikel fehlt, stattdessen WL auf Ergebnisraum, dort fehlerhaft zugeordnet
Begriff der mathematischen Statistik nicht erklärt
Begriff der Stichproben aus endlichen Grundgesamtheiten nicht erklärt

Studentsche t-Verteilung[Bearbeiten | Quelltext bearbeiten]

seltsame Schreibweise für Zufallsvaribalen, z. B. N(0,1) als Symbol für eine standardnormalvereteilte Zufallsvariable
Schreibweise $t_{n}$ für Zufallsvariable, später auch $T_{n}$
unübliche, angeblich DIN-konforme, Schreibweise für Quantile
es fehlt die verallgemeinerte t-Verteilung mit nicht ganzzahligem Freiheitsgradparameter
Konfusion von Quantilwerten mit p-Werten

Suffiziente Statistik[Bearbeiten | Quelltext bearbeiten]

Falsche Verwendung des Begriffs Statistik für einen Wert einer Statistik
Seltsame Schreibweise für bedingte Verteilung

t-Test[Bearbeiten | Quelltext bearbeiten]

Falsche Behauptungen zur Asymptotik
obskurer Verweis auf den falschen Satterthwaite (inzwischen korrigiert)
obskurer Verweis auf "t-Test in Matrixnotation",
uneinheitliche Schreibweise (t versus t)

Testen allgemeiner linearer Hypothesen[Bearbeiten | Quelltext bearbeiten]

Es wird nur ein Spezialfall im Rahmen eines linearen Regressionsmodells behandelt und gleichzeitig behauptet, das wäre schon das multiple Testen

Wahres Modell[Bearbeiten | Quelltext bearbeiten]

angeblich statistischer Grundbegriff

Varianz[Bearbeiten | Quelltext bearbeiten]

Träger falsch definiert und verwendet

Zufallsstichprobe[Bearbeiten | Quelltext bearbeiten]

Konfuse Mischung aus Konzepten der Theorie der Stichproben aus endlichen Grundgesamten (angebbare Wahrscheinlichkeiten, Ziehungsschemata mit und ohne Zurücklegen usw-) und der i.i.d.-Stichproben aus unendlichen Grundgesamtheiten

Zweistichproben-t-Test[Bearbeiten | Quelltext bearbeiten]

falsche Darstellung der Grundgesamtheit
uneinheitliche Quantilnotation
falsche Behauptungen zur Asymptotik
t-Differenzentest als "Zweistichproben-Test"
Beispiele suggerieren, wie man nicht testen sollte, nämlich erstmal rechnen und dann Hypothesen aufstellen
t-Test für nicht normalverteilte Beobachtungen

Akzeptable Seiten zur Statistik[Bearbeiten | Quelltext bearbeiten]

Hypothese (Statistik)[Bearbeiten | Quelltext bearbeiten]

Der insgesamt gute Artikel hat noch Verbesserungsmöglichkeiten. Die Verwendung der Terminologie ist etwas unscharf, etwas uneinheitlich und manchmal zu umgangssprachlich, so dass die statistische Fachterminologie unklar bleibt. Beispiele:

'Nullhypothese gilt', 'Nullhypothese ist erfüllt' anstelle von 'Nullhypothese ist wahr'. Hypothesen sind wahr oder unwahr, Entscheidungen (z. B. die Ablehnung einer Nullhypothese) sind richtig oder falsch. Manchmal werden unwahre Hypothesen (etwas unscharf) als 'falsche Hypothesen' bezeichnet. Diese Bezeichnung sollte man vermeiden, ist bisher auch nicht im Artikel.
' $\theta$ stammt aus $\Theta _{0}$ '.
Die Terminologie 'gerichtete und ungerichtete Hypothese' ist unbelegt und scheint wesentlich Theoriefindung zu sein, um einseitige und zweiseitige Tests zu verstehen. Sie wird vielleicht in bestimmten Anwendungsgebieten verwendet. Das sollte belegt werden.
Naheliegen wäre das Begriffspaar 'einseitige' und 'zweiseitige' Hypothese.
Die Terminologie 'spezifische und unspezifische Hypothese' ist unbelegt und scheint wesentlich Theoriefindung zu sein. Sie wird vielleicht in bestimmten Anwendungsgebieten verwendet. Das sollte belegt werden.
Literatur: Ein Ökonometriebuch – auch wenn es zu besten Ökonometriebüchern gehört – ist als Quelle zu dürftig.
Der Einstichproben-t-Test als Beispiel ist insofern wenig geeignet, da der Parameter $\theta =(\mu ,\sigma )$ ist, wobei die erste Komponente interessiert und der zweite Teil ein lästiger Parameter (nuisance parameter) oder Rauschparameter ist. Bezüglich $\theta$ ist $H_{0}:\mu =0$ eine verkürzte Schreibweise für eine zusammengesetzte Hypothese, die alle Normalverteilungen mit $\mu =0$ und $\sigma >0$ zuläßt. Die Begriffe einfach und zusammengesetzt beziehen sich auf die Mengen zugelassener Verteilungen. Auch der Lilliefors-Test ist ein schlechtes Beispiel, da die Nullhypothese eine nicht einelementige Menge von Wahrscheinlichkeitsverteilungen beschreibt.

Risiko[Bearbeiten | Quelltext bearbeiten]

Statistischer Test[Bearbeiten | Quelltext bearbeiten]

Umfang eines Tests ist falsch definiert

[1] Hermann Witting: Mathematische Statistik I. Parametrische Verfahren bei festem Stichprobenumfang. Teubner, Stuttgart 1985, ISBN 3-519-02026-2, Kap. 1.1, S. 5.

[1]

Benutzer:Sigma^2/Statistik-Seiten

Problematik der Statistik-Seiten in der Wikipedia[Bearbeiten | Quelltext bearbeiten]

Mangelhaftes Niveau der Statistik-Seiten[Bearbeiten | Quelltext bearbeiten]

Ursachen[Bearbeiten | Quelltext bearbeiten]

Qualitätssicherung und "Portal Statistik"[Bearbeiten | Quelltext bearbeiten]

Probleme bei den Artikeln zur Testtheorie[Bearbeiten | Quelltext bearbeiten]

Probleme bei den Artikeln zur mathematischen Statistik[Bearbeiten | Quelltext bearbeiten]

Statistisches Modell und Parametrisierung[Bearbeiten | Quelltext bearbeiten]

Statistik-Seiten mit Qualitätsmängeln[Bearbeiten | Quelltext bearbeiten]

Alphafehler-Kumulierung[Bearbeiten | Quelltext bearbeiten]

Attributables Risiko[Bearbeiten | Quelltext bearbeiten]

Ausfallrate[Bearbeiten | Quelltext bearbeiten]

Bayes-Klassifikator[Bearbeiten | Quelltext bearbeiten]

Bayessche Statistik[Bearbeiten | Quelltext bearbeiten]

Bayessches Netz[Bearbeiten | Quelltext bearbeiten]

Bestimmtheitsmaß[Bearbeiten | Quelltext bearbeiten]

Beurteilung eines binären Klassifikators[Bearbeiten | Quelltext bearbeiten]

Effektstärke[Bearbeiten | Quelltext bearbeiten]

Einstichproben-t-Test[Bearbeiten | Quelltext bearbeiten]

Ereigniszeitanalyse[Bearbeiten | Quelltext bearbeiten]

Fehler 1. und 2. Art[Bearbeiten | Quelltext bearbeiten]

Globaler F-Test[Bearbeiten | Quelltext bearbeiten]

Gammaverteilung[Bearbeiten | Quelltext bearbeiten]

Gauß-Test[Bearbeiten | Quelltext bearbeiten]

Impfstoffwirksamkeit[Bearbeiten | Quelltext bearbeiten]

Inzidenz (Epidemiologie)[Bearbeiten | Quelltext bearbeiten]

Kritischer Wert (Statistik)[Bearbeiten | Quelltext bearbeiten]

Levene-Test[Bearbeiten | Quelltext bearbeiten]

Logistische Regression[Bearbeiten | Quelltext bearbeiten]

Logit[Bearbeiten | Quelltext bearbeiten]

Modus (Statistik)[Bearbeiten | Quelltext bearbeiten]

Multiples Testen[Bearbeiten | Quelltext bearbeiten]

Multiples Testproblem[Bearbeiten | Quelltext bearbeiten]

Post-hoc-Test[Bearbeiten | Quelltext bearbeiten]

Operationscharakteristik[Bearbeiten | Quelltext bearbeiten]

Probit-Modell[Bearbeiten | Quelltext bearbeiten]

Nichtstochastischer versus stochastischer Regressor[Bearbeiten | Quelltext bearbeiten]

Probitfunktion[Bearbeiten | Quelltext bearbeiten]

Regressionsanalyse[Bearbeiten | Quelltext bearbeiten]

Regressionsparameter[Bearbeiten | Quelltext bearbeiten]

Relative und absolute Risikoreduktion[Bearbeiten | Quelltext bearbeiten]

Relatives Risiko[Bearbeiten | Quelltext bearbeiten]

Repräsentativität[Bearbeiten | Quelltext bearbeiten]

ROC-Kurve[Bearbeiten | Quelltext bearbeiten]

Run-Test[Bearbeiten | Quelltext bearbeiten]

Statistischer Test[Bearbeiten | Quelltext bearbeiten]

Statistisches Modell[Bearbeiten | Quelltext bearbeiten]

Stichprobenraum[Bearbeiten | Quelltext bearbeiten]

Studentsche t-Verteilung[Bearbeiten | Quelltext bearbeiten]

Suffiziente Statistik[Bearbeiten | Quelltext bearbeiten]

t-Test[Bearbeiten | Quelltext bearbeiten]

Testen allgemeiner linearer Hypothesen[Bearbeiten | Quelltext bearbeiten]

Wahres Modell[Bearbeiten | Quelltext bearbeiten]

Varianz[Bearbeiten | Quelltext bearbeiten]

Zufallsstichprobe[Bearbeiten | Quelltext bearbeiten]

Zweistichproben-t-Test[Bearbeiten | Quelltext bearbeiten]

Akzeptable Seiten zur Statistik[Bearbeiten | Quelltext bearbeiten]

Hypothese (Statistik)[Bearbeiten | Quelltext bearbeiten]

Risiko[Bearbeiten | Quelltext bearbeiten]

Statistischer Test[Bearbeiten | Quelltext bearbeiten]

Navigationsmenü

Suche