Diskussion:P-Wert

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 8 Monaten von StSchwerdtfeger in Abschnitt Definition
Zur Navigation springen Zur Suche springen

Definition[Quelltext bearbeiten]

Leider ist die Definition nicht korrekt. Es betrifft immer den p-Wert der beobachtete Wert der Testgrösse. Mit der hiesige Definition ist jede p-Wert gleich 0.

Der p-Wert (auch Überschreitungswahrscheinlichkeit genannt) des beobachteten Wert der Testgrösse ist das Infimum des Signifikanzniveaus bei einem Statistischen Test wobei der Nullhypothese abgelehnt wird. Er gibt die Wahrscheinlichkeit an, dass (unter Annahme der Gültigkeit der Nullhypothese H0) die gewonnenen Daten rein zufällig entstanden sein können.

Der p-Wert lässt sich interpretieren als die Wahrscheinlichkeit bei wahre Nullhypothese dass die Testgrösse ein für der Nullhypothese ein gleicher oder ungünstiger Wert annimmt als der beobachtete Wert. Der p-Wert fasst die Beweiskraft der Stichprobe gegen der Nullhypothese zusammen in eine standartisierte Form. Desto kleiner der p-Wert ist, um so mehr Beweis der Stichprobe gegen die Nullhypothese aufweist.

Es gibt, im Zusammenhang mit dem Testverfahren, linksseitige, rechtsseitige und zweiseitige p-Werten.

Nijdam 19:59, 9. Jul 2006 (CEST)

Logischerweise sollte man den Begriff p-Wert unabhaengig von dem Begriff Signifikanzniveau definieren.

Der p-Wert (auch Überschreitungswahrscheinlichkeit genannt) des beobachteten Wert t der Testgrösse T ist der Wahrscheinlichkeit unter der Bedingung der Nullhypothese dass der beobachteten Wert der Testgrösse überschritten wird, dh. die Wahrscheinlichkeit auf Werte die gleich wie t oder mehr gegen die Nullhypothese sprechen. Für linksseitge Tests bedeutet das:

Für rechtsseitige Tests:

Für zweiseitige Tests liegt es etwas komplizierter; der p-Wert ist dann gleich das doppelte vom Minimum des linksseitigen und rechtsseitigen p-Wert:

Der Nullhypothese wird in allen Fälle abgelehnt, wenn der p-Wert kleiner ist als ein vorgewählte Schranke.

Er gibt die Wahrscheinlichkeit an, dass (unter Annahme der Gültigkeit der Nullhypothese H0) die gewonnenen Daten rein zufällig entstanden sein können.

Der p-Wert fasst die Beweiskraft der Stichprobe gegen der Nullhypothese zusammen in eine standartisierte Form. Desto kleiner der p-Wert ist, um so mehr Beweis der Stichprobe gegen die Nullhypothese aufweist. Nijdam 00:37, 10. Jul 2006 (CEST)

Die Wahrscheinlichkeit für Zufall, auch wenn es auf den Aspekt, dass Zufallsvariablen verwendet werden, eingeht, halte ich z.B. immer für ungünstig. Rein linguistisch hatte ich mir da immer gedacht, klingt wie eine Wahrscheinlichkeit einer Wahrscheinlichkeit. "Zufallsvariable" ist ja eher ein sampling constrain sozusagen und beschreibt weniger den p-wert an sich, finde ich. Wenn man diesen Aspekt mit einbringen möchte, dann könnte man sowas sagen wie: Der p-wert P(z<Z|H_0) ist die Wahrscheinl. eine Mittelwertdifferenz zu erhalten (z oder t wert), gegeben dass man randomisiert von einer Populationsverteilung sampled (= H_0; für noe-sample lower-tail z-test).

Man könnte dann noch sowas wie "extrem, noch extremer" einbringen, um klar zu machen, dass man ein Intervall integriert um den p-wert zu erhalten, aber auch dass finde ich irreführend, weil könnte man auch bei einer diskrete prob. mass function sagen, weil damit ja immer nur der Rest gegen unendlich gemeint ist. Wenn ich ein point estimate von .05 erhalte (von einer prob. mass function), dann weiß ich auch, dass alle Werte, die noch weiter von der Mitte der symmetrischen Funktion bzw. noch weiter vom z oder t wert liegen, noch unwahrscheinlicher sind. Ist m.E. aber auch keine distinkte Charakteristik für eine gute und verständliche p-wert Definition... Oder was meint ihr?

Das fand ich auch ein wenig verwirredn; "Der p-Wert fasst die Beweiskraft der Stichprobe gegen der Nullhypothese zusammen in eine standartisierte Form. Desto kleiner der p-Wert ist, um so mehr Beweis der Stichprobe gegen die Nullhypothese aufweist." Unter "mehr Beweis gegen" stelle ich mir sofort einen steigenden Wert vor. Dabei ist ja doch einfach gemeint, umso unwahrscheinlicher wird eine Mittelwertdifferenz, gegeben die H_0. Ich halte letzteres für greifbarer. "Umso mehr Beweis... gegen H_0 aufweist" übersetzt sich m.E. auch in: umso wahrscheinlicher wird die Alternativhypothese (wegen dem "gegen" und der p-wert ist ja nicht gegen oder für, sondern "gegeben H_0"). Ist das verständlich? --StSchwerdtfeger (Diskussion) 16:25, 22. Aug. 2023 (CEST)Beantworten

Überarbeitung[Quelltext bearbeiten]

Ich habe den Artikel überarbeitet; die alte Version vom 2. Mai 2007 war folgende:

Der p-Wert (auch Überschreitungswahrscheinlichkeit oder Irrtumswahrscheinlichkeit genannt) ist das Infimum des Signifikanzniveaus bei einem Statistischen Test. Er gibt die Wahrscheinlichkeit an, dass unter Annahme der Gültigkeit der Nullhypothese H0 die beobachteten Daten oder noch stärker von der Nullhypothese abweichende Daten auftreten.

Der p-Wert ist bei Hypothesentests von Bedeutung. Seine genaue Berechnung ist erst mit Einführung der Rechentechnik bzw. Statistik-Software möglich gemacht worden; er wird heute von jeder gängigen Statistik-Software berechnet. Falls gilt: p-Wert <= Signifikanzniveau α, dann ist H0 abzulehnen.

Ausgehend von einem zweiseitigen Test gibt der p-Wert grafisch die Fläche an, die zwischen der Testgröße und dem rechten oder der negativen Testgröße und dem linken Rand liegt. Die Testgröße kann z.B. einer t-Verteilung folgen. Ein p-Wert von 0,05 entspricht somit genau dem Wert der Testgröße, der auf der Grenze von Beibehaltung und Ablehnung von H0 beim Signifikanzniveau α=0,1 =2*0,05 liegt. (Zum Verständnis: α gibt die "kritische" Fläche unter der Verteilung am rechten und/oder linken Rand an -> α und p-Wert geben also einen Teil der Fläche unterhalb der Dichtefunktion wieder.)

Die Bestimmung des p-Werts kann entweder rechnerisch oder unter Verwendung einer Verteilungstabelle vorgenommen werden. Die Wahl des Signifikanzniveaus ist stets willkürlich und sollte begründet vorgenommen werden. Die häufige Verwendung von 0,05 als Signifikanzniveau geht auf Fishers Verteilungstabellen zurück. Da heute jeder Anwender den p-Wert leicht mittels Statistik-Software bestimmen kann, sind beliebige Signifikanzniveaus leicht zu handhaben. --NeoUrfahraner 23:25, 2. Mai 2007 (CEST)Beantworten

p-Wert als Begriff in der Wasseranalyse[Quelltext bearbeiten]

Ich kann und möchte mich nicht in diese Diskussion einmischen, da mir hierfür jegliche Kompetenz fehlt. Eigentlich war ich auf der Suche nach dem p- und dem m-Wert in der Wasseranalyse...?

Widerspruch Deutsch <-> Englisch[Quelltext bearbeiten]

Hallo, kann es sein, dass sich die Englische und Deutsche Beschreibung widersprechen?


Englisch: The p-value is not the probability of falsely rejecting the null hypothesis. This error is a version of the so-called prosecutor's fallacy.

Deutsch: Der p-Wert gibt die Wahrscheinlichkeit eines Fehlers erster Art an, also die Wahrscheinlichkeit, eine gültige Nullhypothese zu verwerfen, wenn man die Nullhypothese aufgrund der beobachteten Daten ablehnt.

(Der vorstehende, nicht signierte Beitrag stammt von 84.153.39.175 (DiskussionBeiträge) NeoUrfahraner 06:45, 14. Mär. 2008 (CET)) Beantworten

Die deutsche Formulierung ist anscheinend von mir: http://de.wikipedia.org/w/index.php?title=P-Wert&diff=31282810&oldid=31249054 Warum die englische Version das anders sieht, ist mir nicht klar. In der im englischen Artikel angegebenen Quelle http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&pubmedid=11159626 habe ich auch nichts gefunden. Der Verweis auf en:Prosecutor's fallacy lässt vermuten, dass die englische Aussage darauf hinweisen will, dass die getestete Hypothese in einem konkreten Zusammenhang betrachtet werden muss (wie ist man zu Hypothese gekommen? Wurden schon andere Tests durchgeführt?). Der Blickwinkel ist also unterschiedlich: die deutsche Aussage betrachtet einen einzelnen isolierten Test; die englische eine Hypothese in einem größeren Zusammenhang. --NeoUrfahraner 06:45, 14. Mär. 2008 (CET)Beantworten

Die englische Aussage ist richtig, die (jetzige) Formulierung im Artikel ist falsch.Nijdam 00:10, 30. Apr. 2008 (CEST)Beantworten

Dort hat's mir auch keiner richtig erklären können. Das dort angegebene Beispiel von James O. Berger zeigt zwar deutlich, dass der p-Wert nicht die Wahrscheinlichkeit ist, eine gültige Nullhypothese verworfen zu haben, unter der Bedingung, dass man eine Nullhypothese verworfen hat ("Prosecutor's fallacy"). Die Wahrscheinlichkeit für einen Fehler erster Art ist aber die Wahrscheinlichkeit, dass die so genannte Null- bzw. Ausgangshypothese "H_0" abgelehnt wird, obwohl sie richtig ist. Genau diese Wahrscheinlichkeit (unter der Bedignung, dass H_0 gültig ist; nicht aber unter der Bedingung, dass H_0 verworfen wird), gibt doch der p-Wert an. --NeoUrfahraner 08:25, 30. Apr. 2008 (CEST)Beantworten
Es werden einige Sachen durch einander gehohlt. Erstens: Man kann immer die Fehlentscheidung (Fehler erster Art) treffen die Nullhypothese ab zu lehenen obwohl sie richtig ist. Die Wahrscheinlichkeit einen solchen Fehler heisst Signifikanzniveau α (in anderen Sprachen: "Unzuverlaessigkeit"). Aber es gibt zwei Arten einen Test durch zu fuehren. 1. Man bestimmt im voraus einen kritischen Gebiet Z und lehnt die Nullhypothese ab wenn der gefunde Wert der Teststatistik in Z faellt. 2. Man bestimmt im voraus das Signifikanzniveau α und lehnt die Nullhypothese ab wenn der p-Wert des gefundenes Wertes der Teststatistik unter α liegt. Der p-Wert ist also einen Zahl der zu dem gefundene Wert der Teststatistik gehoert und erzaehlt wie gross die Wahrscheinlichkeit ist ein solcher oder extremaler Ergebnis zu finden wenn die Nullhypothese richtig ist.Nijdam 17:41, 6. Mai 2008 (CEST)Beantworten
Und genau das ist doch die (bedingte) Wahrscheinlichkeit für einen Fehler erster Art (unter der Bedingung, dass die Nullhypthese richtig ist). --NeoUrfahraner 21:18, 6. Mai 2008 (CEST)Beantworten
Ist es nicht! Wieso denkst du dass???Nijdam 01:19, 8. Mai 2008 (CEST)Beantworten
Die Wahrscheinlichkeit ein solcher oder extremaler Ergebnis zu finden wenn die Nullhypothese richtig ist, ist der p-Wert. Ich lehen die Nullhypothese ab, wenn ein solches oder extremaleres Ergebnis gefunden wird.

<<Kommentar: Nein, nur wenn der p-Wert zu klein ist.Nijdam 23:07, 9. Mai 2008 (CEST)Beantworten

Das ist äquivalent. Genau dann, wenn ein solches oder extremaleres Ergebnis gefunden wird, dann ist der p-Wert zu klein. --NeoUrfahraner 10:42, 10. Mai 2008 (CEST)Beantworten

Die Wahrscheinlichkeit, die Nullhypothese abzulehnen, wenn die Nullhypothese richtig ist, ist somit der p-Wert.

<<Kommentar: Nein, das ist das Signifikanzniveau.Nijdam 23:07, 9. Mai 2008 (CEST)Beantworten

Das eine schließt das ander nicht aus. Der p-Wert ist das (kleinste) Signifikanzniveau, zu dem ich die Nullhypothese ablehnen würde. Wenn der p-Wert 7,5% ist, würde ich die Nullhypothese bei einem Signifikanzniveau von 10% ablehnen und bei einen Signifikanzniveau von 5% annehmen. --NeoUrfahraner 10:42, 10. Mai 2008 (CEST)Beantworten

Wenn ich die Nullhypothese ablehne, obwohl sie richtig ist, begehe ich einen Fehler erster Art. Die Wahrscheinlichkeit, einen Fehler erster Art zu begehen, wenn die Nullhypothese richtig ist, ist somit der p-Wert. --NeoUrfahraner 15:45, 9. Mai 2008 (CEST)Beantworten

Ich verstehe nicht welches eine welches andere nicht ausschliesst. Du sagt selber schon: "Wenn der p-Wert 7,5% ist, würde ich die Nullhypothese bei einem Signifikanzniveau von 10% ablehnen". Da sagst du doch dass der p-Wert unterschieden ist van das Signifikanzniveau (= Wahrscheinlichkeit eines Fehlers erster Art).Nijdam 16:01, 10. Mai 2008 (CEST)Beantworten
Der p-Wert ist das (kleinste) Signifikanzniveau, zu dem ich die Nullhypothese ablehnen würde. Oder andersrum: Wenn der p-Wert 7,5% ist, würde ich bei einem Signifikanzniveau von 7,5% die Nullhypothese ablehen. Oder andersrum: wenn ich die Nullhypothese ablehne, wenn der p-Wert kleiner gleich 7,5% ist, entspricht das einem Signifikanzniveau von 7,5%. --NeoUrfahraner 17:25, 10. Mai 2008 (CEST)Beantworten
Hier geht's schief. p=0,075 -> ich lehne Ho ab bei jedes Signifikanzniveau >= 0,075.Nijdam 19:26, 12. Mai 2008 (CEST)Beantworten
Sag ich ja: Der p-Wert ist das (kleinste) Signifikanzniveau, zu dem ich die Nullhypothese ablehnen würde. Das ist wie beim Signifikanztest: Du lehst H0 ab, wenn (bei einem einseitigen Test) die Teststatistik T größer gleich dem kritischen Wert --NeoUrfahraner 08:42, 14. Mai 2008 (CEST)Beantworten
Signifikanzniveau sagt etwas vom Test und nichts vom Ergebnis der Stichprobe. Dagegen sagt p-Wert etwas vom Ergebnis der Stichprobe und nur implizit etwas vom Test.Nijdam 19:32, 12. Mai 2008 (CEST)Beantworten
Häh? Wenn Du mittels Signifkanzniveau testest, ignorierst Du dann die Stichprobe? Natürlich nicht, Du legst abhängig vom Signifikanzniveau des Tests irgendwelche Grenzen fest, und wenn die sich aus der Stichprobe ergebende Teststatistik außerhalb dieser Grenzen liegt, lehnst Du die Nullhypothese ab. Beim p-Wert machst Du das im Prinzip genauso, nur legst Du nicht die Grenzen für die Teststatistik fest, sondern vergleichst direkt den p-Wert der Teststatistik mit dem Signifikanzniveau. Das ist mathematisch völlig äquivalent. --NeoUrfahraner 08:42, 14. Mai 2008 (CEST)Beantworten
I rest my case: Du verstehst etwas von Statistik, aber hast Schwierigkeiten mit Logik.Nijdam 14:26, 14. Mai 2008 (CEST)Beantworten
Welchen Gedankenschritt kannst Du logisch nicht nachvollziehen? --NeoUrfahraner 16:25, 14. Mai 2008 (CEST)Beantworten
PS: Du kannst ja gerne eine Literaturstelle zitieren, die erklärt, was Du meinst; vielleicht wird's dann klarer. --NeoUrfahraner 06:45, 15. Mai 2008 (CEST)Beantworten

OK, ich versuch es noch einmal. 1) Mann kann nicht sagen: "Wenn Du mittels Signifkanzniveau testest...". In beiden Faelle, mit kritischem Gebiet oder mit p-Wert, gibt es ein Signifkanzniveau. 2) Wieso fragst du: "ignorierst Du dann die Stichprobe?" Davon ist nirgends die Rede. Aber man braucht die Auskunft der Stichprobe nicht zu kennen um das Signifkanzniveau zu bestimmen. 3) Um den p-Wert zu bestimmen, braucht mann aber die Auskunft der Stichprobe. 4)Wie du selber erwaentest: der p-Wert braucht nicht gleich dem Signifkanzniveau zu sein. Der p-Wert kann 0,001 sein, waehrend das Signifkanzniveau gleich 0,05 ist.Nijdam 23:59, 15. Mai 2008 (CEST) Beispiel: X ist binomiaal verteilt n=7. H0: p=0,5 und H1: p>0,5. Eine Wahrnemung x. Waehle als Grenze des Signifkanzniveaus 0,10. Dann erfolgt fuer den kritischen Wert P(X>=c|p=0,5) <= 0,10. Gibt c=6 und das Signifkanzniveau = 1/16. Gefunden: x=5. p-Wert (van x) = P(X>=x|p=0,5) = 0,5.Nijdam 00:12, 16. Mai 2008 (CEST)Beantworten

Statt P(X>=x|p=0,5) = 0,5 meinst Du wohl
Hab ich das so richtig verstanden? --NeoUrfahraner 06:42, 20. Mai 2008 (CEST)Beantworten
Hast Recht, ich hatte anfangs x=4 genommen. Ist dir die Unterschied jetzt auch klar geworden?Nijdam 21:13, 20. Mai 2008 (CEST)Beantworten
Teils-Teils. Was Du anscheinend meinst, ist, dass das Signifikanzniveau sozusagen vor dem Test festgelegt wird. Also kritischer Wert c=6 entspricht Signifikanzniveau 1/16 und ablehnen der Nullhypothese bei x>=6 oder p-Wert<=1/16. Worauf ich hinaus will, ist, dass ich umgekehrt sagen kann, wenn ich beim gefundenen (oder noch kleinerem) p-Wert 0,23 ablehne, ist das äquivalent zu einem Test mit kritschem Wert c=5 und Signifikanzniveau 23%. --NeoUrfahraner 20:36, 21. Mai 2008 (CEST)Beantworten
Das ist bestimmt nicht äquivalent. Kritischen Wert c=5 bedeutet nur dass man jetzt weisst wie man entscheiden soll, und dass das Signifikanzniveau gleich 0,23 ist, aber richtig entscheiden kann mann erst nach Wahrnehmung. P-Wert = 0,23 bedeutet die Wahrnehmung sei x=5 gewesen, aber wie mann entscheiden soll weisst mann erst wenn mann das Signifikanzniveaugewaehlt hat.Nijdam 23:50, 21. Mai 2008 (CEST)Beantworten
  1. "Verwirf, wenn x>=5" ist äquivalent zu "Verwirf, wenn p-Wert<=29/128 (ca. 0,23) "
  2. "Verwirf, wenn x>=6" ist äquivalent zu "Verwirf, wenn p-Wert<=1/16 (ca. 0.08)" --NeoUrfahraner 06:56, 22. Mai 2008 (CEST)Beantworten
Also (ziemlich logisch): "Verwirf, wenn x>=c" ist äquivalent zu "Verwirf, wenn p-Wert (van x) = P(X>=x|H0)<= P(X>=c|H0)".Nijdam 09:53, 22. Mai 2008 (CEST)Beantworten
Ja, genau. --NeoUrfahraner 13:04, 22. Mai 2008 (CEST)Beantworten
Siehst du nun auch den Unterschied? So wie x und c verschieden sind, so sind auch ihre Gegenstuecke, der p-Wert (von x) und das Signifikanzniveau (="p-Wert" von c), verschieden.Nijdam 21:37, 23. Mai 2008 (CEST)Beantworten
Der Unterschied ist, ein Mal geht man von Signifikanzvieau aus und bestimmt den kritischen Wert c, das andere Mal interpretiert man x als kritischen Wert und fragt, welchem Signifikanzniveau das entspricht. Deswegen ist es "äquivalent": ein Mal von links nach rechts, ein Mal von rechts nach links: Der p-Wert von c ist das (gegebene) Signifikanzniveau. Oder: Nehme ich den gefundenen p-Wert von p(x) als kritischen Wert, so entspricht das einem Test mit Signifikanzniveau p(x). Jedem Signifikanztest entspricht ein kritischer p-Wert, und zu jedem p-Wert gibt es einen Test mit entsprechenden Signifikanzniveau. Du betrachtest einen fix vorgegenen Test, ich betrachte alle möglichen Tests (eines bestimmten Typs). --NeoUrfahraner 06:53, 24. Mai 2008 (CEST)Beantworten
Ich gebe auf, vermutlich willst oder kannst du es nicht verstehen.Nijdam 16:52, 27. Mai 2008 (CEST)Beantworten
Wie schon (06:45, 15. Mai 2008) gesagt, Du kannst gerne eine Literaturstelle angeben, in der es genauer erklärt wird. --NeoUrfahraner 17:11, 27. Mai 2008 (CEST)Beantworten

Formulierungen[Quelltext bearbeiten]

Abgesehen von der fachlichen Diskussion, die ich interessiert in der Hoffnung auf eine Einigung unter den Beteiligten oder durch einen kundigen Dritten verfolge, würde ich gern anregen, auch etwas auf die formale Qualität und Konsistenz der Wikipedia-Artikel zu achten. Insbesondere bei diesem Artikel ist mir aufgefallen, dass einige Formulierungen grammatisch verquer ("Bei rechtsseitiger Test" etc.; ) und daher manchmal nahezu unverständlich sind ("Es ist unter der Nullhypothese die Wahrscheinlichkeit der Menge Werte zu der die gefundene Wert noch gerade gehört."). Gleich dreimal taucht der Typo "Signifkanzniveau" auf (das dritte "i" fehlt!). Ich persönlich würde es auch für hilfreich halten, anstatt eines Hyperlinks auf die wiederum recht umfangreiche Seite "Bionomialverteilung" die hier anzuwendende Formel mit Definition der einzusetzenden Größen (einschließlich "j"!) wiederzugeben, bevor die numerische Ausführung erklärt wird. Insgesamt: Die derzeitige Fassung dieses Artikels, ob nun in allen Einzelheiten korrekt oder nicht, erschwert es schon aus formalen Gründen sehr, etwas daraus zu lernen. 18. Mai 2008

Statt solche nicht-unterzeichnete Bemerkungen zu machen, koenntest du auch versuchen den Text zu verbesseren und dankbar sein dass ein nicht-deutsche Sachkundiger sich bemueht hatt Fehler aus dem Artikel heraus zu schaffen und eine ausfuerliche Erklaerung zu geben.Nijdam 22:42, 19. Mai 2008 (CEST)Beantworten

Hallo Nijdam, ich finde diesen Satz auch schwer verständlich: "Es ist unter der Nullhypothese die Wahrscheinlichkeit der Menge Werte zu der der gefundene Wert noch gerade gehört. " Was meinst du mit "die Menge Werte"? Hier ein Vorschlag für eine andere Formulierung (bitte prüfen): "Bei gültiger Nullhypothese gibt der p-Wert die Wahrscheinlichkeit an, dass ein Wertebereich auftritt, zu dem der gefundene Wert gehört" Oder, andere Variante: "Bei gültiger Nullhypothese gibt der p-Wert die Wahrscheinlichkeit an, dass ein gefundener Wert auftritt" 89.13.155.231 18:21, 31. Jul. 2008 (CEST)Beantworten

Noch eine mögliche Formulierung (?): Der P-Wert gibt die Wahrscheinlichkeit an, dass eine gültige Nullhypothese zu dem beobachteten Ergebnis führt (Variante: das beobachtete Ergebnis erklären kann). 194.120.84.9 16:33, 4. Aug. 2008 (CEST)Beantworten

Ich habe die Formulierung etwas geaendert. Vielleicht ist es so deutlicher.Nijdam 11:09, 12. Aug. 2008 (CEST)Beantworten

Ich finde die Formulierung ziemlich extremal unverständlich. -- ~ğħŵ 12:08, 12. Aug. 2008 (CEST)Beantworten


laut: http://www.rbsd.de/PDF/DMW/DMW-2007-S1-07.pdf ist es genau andersrum, wie im artikel beschrieben. Der p-wert sollte geringer als das festgelegte signifikanzniveau sein. recht andere Erklärung auf http://www.evimed.ch/glossar/p_wert.html , die zustimmen, dass der p wert klein sein sollte. Ist mit dem Artikel nicht vereinbar, also entweder dort ein Fehler, oder in dem Wiki Artikel.

---diplomand.mails@gmail.com (nicht signierter Beitrag von 188.100.210.128 (Diskussion) 18:56, 18. Feb. 2011 (CET)) Beantworten

Du lässt dich von "Nullhypothese ablehnen" irritieren. Und Evimed ist falsch. --Erzbischof 19:40, 18. Feb. 2011 (CET)Beantworten

Überarbeitung[Quelltext bearbeiten]

Ungeachtet der Redundanzmarkierung versuche ich einige Änderungen an dem Artikel vorzunehmen. Außerdem vergleiche ich die Informationen über den p-Wert hier mit denen in anderen Artikeln. Obwohl der Artikel m.E. eine eigene Daseinsberechtigung besitzt, kann er dann auch u.U. in einen anderen Artikel eingegliedert werden. Änderungen und dringend nötige Einzelnachweise folgen. -- MM-Stat 19:42, 2. Okt. 2009 (CEST)Beantworten

Verständlichkeit[Quelltext bearbeiten]

Dieser Artikel ist schon in der Einleitung viel zu kompliziert und verletzt WP:OMA eklatant. Als Nicht-Mathematiker/Statistiker wurde ich bereits im zweiten Satz abgehängt, habe in medizinischen Studien Angaben des P-Werts gefunden und wollte bloß eine grobe Einschätzung erlangen, was dieser aussagt. --92.228.88.126 12:23, 13. Apr. 2010 (CEST)Beantworten

Vielleicht hilft Folgendes (sei mir bitte behilflich mit deutsch)

Erweiterung zur Einleitung (Vorschlag)[Quelltext bearbeiten]

Der p-Wert ist eine Zahl zwischen 0 und 1, bestimmt durch das Ergebnis der Stichprobe, der Andeutet wie glaubenswert es ist ein solches Ergebnis zu finden wenn der Nulhypothese richtig ist, und damit umgekehrt, wie glaubenswert der Nullhypothese ist im Ramen dieses Ergebnisses. Der p_Wert ist die Wahrscheinlichkeit, unter der Nulhypothese, auf ein Ergebnis wie das Gefundene oder Extremalere. Damit wird also Angedeutet wie extremal das Ergebnis ist: um so kleiner der p-Wert, desto mehr spricht das Ergebnis gegen die Nullhypothese. Werte kleiner als eine im voraus festgestellte Grenze, wie 5, 1 oder 0,1 % sind Anlass die Nullhypothese abzulehnen. Nijdam 13:10, 14. Apr. 2010 (CEST)Beantworten

Hallo, Nijdam. Ohne inhaltlich etwas geändert zu haben, die gewünschte Korrektur:
Der p-Wert ist ein Wert zwischen Null und Eins, bestimmt durch die gezogene Stichprobe, der andeutet, wie glaubhaft es ist, ein solches Stichprobenergebnis zu erhalten, wenn die Nulhypothese wahr ist, und damit umgekehrt, wie glaubhaft die Nullhypothese bei Erhalt dieses Stichprobenergebnisses ist. Der p-Wert ist die Wahrscheinlichkeit, unter Gültigkeit der Nulhypothese das erhaltene Ergebnis oder ein extremeres zu erhalten. Mit dem p-Wert wird also angedeutet wie extrem das Ergebnis ist: um so kleiner der p-Wert, desto mehr spricht das Ergebnis gegen die Nullhypothese. Werte kleiner als eine im voraus festgesetzte Grenze, wie 5%, 1% oder 0,1% sind Anlass, die Nullhypothese abzulehnen. Viele Grüße, MM-Stat 20:40, 18. Apr. 2010 (CEST)Beantworten
@MM-Stat: Vielen Dank, ich fuege es im Artikel hinein.Nijdam 18:21, 19. Apr. 2010 (CEST)Beantworten

Grundwissen für Edits an p-Wert[Quelltext bearbeiten]

Ein Tipp: erst sachkundig machen, dann Artikel editieren:

  • Anteile werden in Prozenten angegeben (z.B. relative Häufigkeiten), Wahrscheinlichkeiten sind jedoch Zahlen zwischen Null und Eins. Nach Deinem Edit stand in dem Abschnitt sinngemäß "p-Werte kleiner als 5%, 1%...". Siehst Du, wie falsch das ist?
  • Die Wahrscheinlichkeit ist deshalb bedingt, weil der p-Wert die Gültigkeit der Nullhypothese voraussetzt, in den Formeln erkennbar am senkrechten Strich.

--Arno Matthias 14:24, 11. Aug. 2010 (CEST)Beantworten

Ich weiss nicht wie gut du dich auskennst in Wahrscheinlichkeit und Statistik, aber es ist durchaus ueblich Wahrscheinlichkeiten in Prozenten auszudruecken. Die angedeutete Wahrscheinlichkeit ist keine bedingte Wkeit. Zwar steht eine senkrechte Strich zwischen den klammern, hat aber nicht die gleiche Bedeutung wie in bedingter Wkeit. Die Nullhypothese ist kein Ereignis im Wahrscheinlichkeitsraum. Nijdam 00:34, 12. Aug. 2010 (CEST)Beantworten

Kleiner Fehler im letzten Abschnitt[Quelltext bearbeiten]

Bei http://de.wikipedia.org/wiki/P-Wert#Beziehung_zum_Signifikanzniveau müsste es heißen kleiner gleich. Also wenn p <= alpha ist, wird H_0 abgelehnt. Der Fehler besteht im Text, als auch in der Formel. -- Uboot85 16:55, 22. Feb. 2011 (CET)Beantworten

Nein, das ist ok. Wie du richtigerweise beim t-Test festgestellt hattest, gehören die kritischen Werte zum Nichtablehnungsbereich der H0. D.h. also wenn der Prüfwert genau dem kritischen Wert ist, dann müssen wir H0 annehmen. Dann ist aber gerade . --Sigbert 19:25, 22. Feb. 2011 (CET)Beantworten
Auch das englische Wiki sagt, dass es bei kleiner gleich so ist: http://en.wikipedia.org/wiki/P-value#Interpretation -- Uboot85 23:28, 22. Feb. 2011 (CET)Beantworten

Der P-Wert ist doch das kleinste Signifikanzniveau auf dem H_0 noch abgelehnt wird. So ist der doch definiert! -- Uboot85 17:10, 25. Feb. 2011 (CET)Beantworten

Beziehung p-Wert und Signifikanzniveau[Quelltext bearbeiten]

Es gibt ueberhaupt keine Beziehung zwischen dem p-Wert und dem Signifikanzniveau, wie im Artikel geschrieben. Es gilt nur die Aekwivalenz: . Nijdam (Diskussion) 00:43, 4. Dez. 2012 (CET)Beantworten

Gemeint ist vermutlich: Es gibt eine Äkwivalenz zwischen einem Testverfahren mit Berechnung des p-Wertes und einem Verfahren mit dem im Voraus bestimmten Signifikanzniveau. Der p-Wert berechnet sich anhand des beobachteten Wertes der Teststatistik, und der kritische Wert folgt aus dem Signifikanzniveau , so gilt z. B. rechtsseitig ... usw. Nijdam (Diskussion) 01:02, 4. Dez. 2012 (CET)Beantworten

Diese Aussage am Anfang ist auf jeden Fall falsch: "Der p-Wert entspricht dann dem kleinsten Signifikanzniveau, bei dem die Nullhypothese gerade noch verworfen werden kann." Zur Berechnung des p-wertes muss kein Signifikanzniveau festgelegt werden und spielt in der Rechnung auch keine Rolle. Der p-Wert ist keine threshold, im Gegenteil P(z<Z|H_0) bspw. geht davon aus, dass die H_0 immer wahr ist - also Voraussetzug. Es ist üblich, dass man den p-wert mit dem Signifikanztest verwechselt. Steht ja sogar auch im Text. Es sollte wenn dann heißen: "Das Signifikanzniveau entspricht einem p-Wert, bspw. 0.05, bei dem die Nullhypothese gerade noch verworfen werden kann." ... passt aber an dieser Stelle trotzdem nicht, weil es ja um dem p-Wert und nicht um den Signifikanztest (p-wert < oder > threshold) gehen soll....

--StSchwerdtfeger (Diskussion) 16:00, 22. Aug. 2023 (CEST)Beantworten

extrem, extremer, am extremsten?[Quelltext bearbeiten]

Ein Artikel mit wissenschaftlichem Anspruch sollte auf Unsinnigkeiten wie ... oder ein noch extremeres ... verzichten. (nicht signierter Beitrag von 91.66.30.218 (Diskussion) 22:57, 3. Jan. 2015 (CET))Beantworten

"extrem" ist an dieser Stelle oder im Folgenden unzureichend definiert. Bezieht es sich auf die Abweichung vom Mittelwert, vom Erwartungswert des Ergebnisses oder auf die Wahrscheinlichkeit im Rahmen der Null-Hypothese?--Moritzgedig (Diskussion) 12:37, 8. Feb. 2021 (CET)Beantworten
Ich finde diese Definition auch verwirrend. Der Grund ist ja der, dass man eine continuous prob. dens. function integrieren muss und daher immer ein Intervall in betracht zieht, sodass mit "noch extremer" bspw. alle z-/t-werte gemeint, die noch weiter weg liegen. Problematisch finde ich aber, dass im Falle von einem Integral von -/+ unendlich bis z-/t-wert einfach ein Rest gemeint ist. Selbst bei einer discrete prob. mass function mit Gaußscher Form könnte man sagen, dass alle Werte, die noch weiter Weg von der "Mitte" liegen, noch unwahrscheinlicher sind, auch wenn man ein point estimate bestimmt (+ die symmetrische und Gaußsche Form der Funktion spielt eine Rolle bei so einer Beschreibung). Dann ist das Problem, dass man gar nicht a priori weiß, ob ein Wert "extrem" ist, da der sample mean ja auch gleich dem pop. mean sein könnte, sodass keine z-/t-wert Differenz besteht. In so einem Falle bekäme man bei einem two-tailed test einen p-wert von 1 und ich wüsste nicht, was da "extrem oder noch extremer" noch für eine Bedeutung hat. Eine gute Definition sollte daher m.E. immer die Mittelwertdifferenz in den Fordergrund rücken, dann lässt sich nämlich auch die Formel einfach aussprechen als P(z<Z|H_0), die Wahrscheinlichkeit einer Mitteldiffernz, gegeben die Nullhypothese, wobei die Nullhypothese letztlich schlicht die Populationsverteilung meint.

--StSchwerdtfeger (Diskussion) 15:53, 22. Aug. 2023 (CEST)Beantworten

Stil[Quelltext bearbeiten]

... ein solches Stichprobenergebnis oder ein noch extremeres zu erhalten ... Abgesehen davon, daß es grausam ist, in einem mathematischen Artikel Unfug wie "ein noch extremeres" zu lesen, ist nicht erkennbar, was unter einem "extremen Stichprobenergebnis" zu verstehen ist.

Den Text hat nie und nimmer ein Mathematiker geschrieben (jedenfalls möchte ich es nicht hoffen). (nicht signierter Beitrag von 91.66.30.11 (Diskussion) 11:59, 30. Sep. 2015 (CEST))Beantworten

Das wurde schon öfter angemerkt, siehe auch eins drüber. Hat jemand Formulierungsvorschläge? Mir fällt gerade nichts ein … -- HilberTraum (d, m) 12:45, 30. Sep. 2015 (CEST)Beantworten
@HilberTraum: Ja, indem man klar stellt in welcher Beziehung es zu was "extremer" ist. Bezieht es sich auf die Abweichung vom Mittelwert, vom Erwartungswert des Ergebnisses oder auf die Wahrscheinlichkeit im Rahmen der Null-Hypothese?

Man könnte auch einen Wert so definieren:
Diese/s Beobachtung/Ergebnis liegt auf der Grenze die in einem Raum der Abweichungen vom Erwartungswert (laut Null-Hypothese) die Einhüllende bildet die x% der Wahrscheinlichkeit einschließt.
Oder:
Diese Beobachtung gehört zu den y% unwahrscheinlichsten.
So ist der p-Wert aber nicht gemeint. --Moritzgedig (Diskussion) 12:47, 8. Feb. 2021 (CET)Beantworten

Einleitung[Quelltext bearbeiten]

"Er [der p-Wert]] steht in enger Beziehung zu dem Signifikanzniveau, ...". 1. Es gibt keinerlei formale Beziehung zwischen dem p-Wert und dem Signifikanzniveau. Der p-Wert ist eine durch die Stichprobenwerte bestimmte Zahl, die zwischen 0 und 1 liegt. Das Signifikanzniveau ist eine unabhängig von den beobachteten Stichprobenwerten durch den Benutzer festgelegte Zahl zwischen 0 und 1, die bei einem statistischen Testverfahren die Wahrscheinlichkeit für den Fehler erster Art nach oben beschränkt. Genauso unsinnig wäre zu behaupten, der beobachtete Wert einer Teststatistik stünde "in enger Beziehung zum Signifikanzniveau". 2. Es heißt nicht " zu dem" sondern "zum". --Sigma^2 (Diskussion) 17:38, 28. Sep. 2017 (CEST)Beantworten

Hast Recht, ich halte die Formulierung wegen der, von dir, genannten Punkte auch für schlecht. Grüße. --JonskiC (Diskussion) 17:45, 28. Sep. 2017 (CEST)Beantworten
Demnächst gehe ich an die Änderung. --Sigma^2 (Diskussion) 17:59, 28. Sep. 2017 (CEST)Beantworten

" er ... [der p-Wert] lässt sich aber nicht ohne Weiteres in Tabellen fassen". Worauf bezieht sich das "aber"; wo ist der Gegensatz? Was soll "ohne Weiteres" heißen, er lässt sich auch nicht "mit Weiterem" in Tabellen fassen, da er ein realisierter Wert einer Zufallsvariablen ist und von der dem Testverfahren zugrundeliegenden Stichprobe abhängt. Zu viele unscharfe Sprachspreizungen. --Sigma^2 (Diskussion) 17:59, 28. Sep. 2017 (CEST)Beantworten

Erster Satz: Wer nennt den einen p-Wert Überschreitungswahrscheinlichkeit oder Signifikanzwert. Ich halte beides für Unsinn. Was zu finden ist, ist empirisches Signifikanzniveau.--Sigma^2 (Diskussion) 14:41, 2. Feb. 2023 (CET)Beantworten

Kritik am p-Wert[Quelltext bearbeiten]

Das sollte vielleicht im Kritikabschnitt erwähnt werden: https://www.nature.com/articles/d41586-019-00857-9Godung Gwahag (Diskussion) 10:32, 23. Mär. 2019 (CET)Beantworten

Der Kritikabschnitt hat momentan gar keine Einzelnachweise, das geht in WP eigentlich gar nicht, egal zu welchem Thema. Außerdem scheint mir dort Kritik am p-Wert vermischt mit allgemeiner Kritik an statistischen Tests und mit (vorher schon genannten) Fehlinterpretationen. -- HilberTraum (d, m) 21:08, 18. Jun. 2019 (CEST)Beantworten
Die Belege dazu kann ich noch nachreichen...wichtiger wäre es mE erstmal das Mathematische auf Vordermann zu bringen. Bereits der erste Satz der mathematischen Beschreibung "Bei einem statistischen Test wird eine Vermutung (Nullhypothese) überprüft [...]" ist falsch oder mindestens missverständlich.--Jonski (Diskussion) 23:28, 18. Jun. 2019 (CEST)Beantworten

Unleserlich für Nichtmathematiker[Quelltext bearbeiten]

Ich weiß, dass es keinen Königsweg zur Mathematik gibt. Aber der Artikel ist für Nichtmathematikrer nutzlos. Falls jemand was Verständliches sucht: Novustat. Und nein, ich habe nichts mit Novustat zu tun.--Gerald Fix (Diskussion) 11:03, 16. Jul. 2021 (CEST)Beantworten

In einem einfachen Spezialfall ist immer alles ganz einfach. Der Fall ist in drei Beziehungen ein Spezialfall. Erstens: einfache Nullhypothese, zweitens: einseitiger Test, drittens: bestimmte Monotonieeigenschaften der Wahrscheinlichkeitsverteilungen, die das geschilderte Vorgehen ermöglichen, über die aber nichts gesagt wird. Wer das Arbeiten mit p-Werten verstehen will und diese nicht nur einfach anwenden will, der muss sich mühen und studieren (lat. studio = ich mühe mich). Nützlich wäre es genau die Stelle anzugeben, ab der es unverständlich wird. --Sigma^2 (Diskussion) 14:42, 2. Feb. 2023 (CET)Beantworten

Beispiel falsch?[Quelltext bearbeiten]

Warum wird im Beispiel die Wahrscheinlichkeit immer mit 2 multipliziert? Wenn beim Münzwurf P(Y>=15) gelten soll, dann ist das die Summe der Binomialverteilungen wahlweise von j=15-20 oder j=0-5 (bei fairer Münze). Warum diese Wahrscheinlichkeit hier mit 2 multipliziert wird bzw. doppelt bestimmt wird, ist mir ein Rätsel. Siehe aus englische Version. (nicht signierter Beitrag von 2003:E0:F24:A700:75FB:67E4:DD36:7C7D (Diskussion) 17:19, 13. Jan. 2022 (CET))Beantworten

Beispiel muss ergänzt werden![Quelltext bearbeiten]

Das Beispiel ein zweiseitiger Test. Der Hinweis fehlt. (nicht signierter Beitrag von 87.78.182.218 (Diskussion) 09:23, 5. Aug. 2022 (CEST))Beantworten