Diskussion:Quantil (Wahrscheinlichkeitstheorie)

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 7 Monaten von Sigma^2 in Abschnitt Empirisches Quantil
Zur Navigation springen Zur Suche springen
Zum Archiv
Wie wird ein Archiv angelegt?
Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 7 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind.

Empirisches Quantil[Quelltext bearbeiten]

Ein empirisches Quantil ist ein der beobachteten Werten, oder gewogenes Mittel zweier solcher Daten. Was in dem Abschnitt definiert wird ist nicht das Quantil, sondern die empirische Verteilungsfunktion. Nijdam 12:13, 6. Dez. 2010 (CET)Beantworten

Upps, du hast recht... Da ich es geschrieben habe, nehme ich es raus und verschiebe erstmal zu mir. Danke --Sigbert 19:40, 6. Dez. 2010 (CET)Beantworten

(1) Beachtet man, dass der Median ein 0.5-Quantil ist, so stehen beide Definitionen im Widerspruch zueinander.

(2) Die Definition einen q-Quantils muss völlig unabhängig von der gegebenen Liste sein. D.h. es muss theoretisch möglich sein z.B. ein 0.23-Perzentil einer Liste mit einem einzigen Element zu berechnen, was bei fast allen Formeln nicht möglich ist.

(3) Bei allem, was ich in den letzten Wochen so über Statistik lese: Mit welchem Recht nennen sich diese Deppen eigentlich Mathematiker?? (nicht signierter Beitrag von 84.174.96.217 (Diskussion) 09:00, 23. Feb. 2015 (CET))Beantworten

Hallo alle zusammen,
zu Bemerkung (2) der IP:
Angenommen, ich habe eine Stichprobe mit dem Umfang n=1. Der Proband Arthur Dent antwortet auf die Frage, wie alt er sei mit »42«. ;-) Daraus lassen sich folgende deskriptive Statistiken ableiten:
  • Modus (häufigster Wert): 42
  • Minimum: 42
  • Maximum: 42
  • Range (Spannweite): 0
  • arithmetisches Mittel: 42
  • Standardabweichung: 0
  • Median: 42
  • erstes Quartil: Bestimmung nicht möglich
  • drittes Quartil: Bestimmung nicht möglich
  • Interquartilabstand: Bestimmung nicht möglich (bei n=1 gibt es keine »mittleren 50 Prozent«)
  • Fallzahl: 1
Jede deskrptive Statistik, und das von der IP erwähnte 0,23-Perzentil ist so eine deskriptive Statistik, genauer: ein Lagemaß, bezieht sich immer auf die konkret gegebene Stichprobe. Diese Stichprobe wird durch die deskriptiven Statistiken in bestimmten Eigenschaften beschrieben. Deshalb heißen sie deskriptiv.
Eine Stichprobe hat immer einen bestimmten Umfang. Das heißt, sie enthält eine bestimmte (endliche) Anzahl an Fällen. Das wird dann Fallzahl genannt und mit n abgeküzt. Die Fallzahl ist absolut skaliert, wie Stückzahlen oder die Anzahl lebend geborener Babys in einem bestimmten Jahr. Das bedeutet: ein Fall ist die kleinste Einheit. Ein Fall kann nicht noch einmal geteilt werden.
Wenn n=1 ist, dann kann schon einen Median ermittelt werden. Es gibt dann in einer sortierten Urliste einen Fall, bei dem genausoviele Fälle einen kleineren oder gleich großen wie einen gleich großen oder größeren Wert als dieser Fall aufweisen, nämlich jeweils genau null Fälle (links und rechts dieses einen und einzigen Falles). Bei n=1 aber einen Wert zu finden, der entweder einem bestimmten real existierenden Fall entspricht oder sich zwischen den Werten zweier benachbarter Fälle bewegt (bei n=1!), so dass ungefähr 23 Prozent aller Fälle einen kleineren oder gleich großen und ungefähr 77 Prozent einen gleich großen oder größeren Wert aufweisen, ist bei einem Stichprobenumfang von n=1 schlicht nicht möglich. Wie soll das bewerkstelligt werden?
Also ist ein empirisches q-Quantil eines ganz bestimmt nicht: unabhängig von der sortierten Urliste einer gegebenen Stichprobe.
Viele Grüße
--Jake2042 (Diskussion) 15:57, 18. Sep. 2019 (CEST)Beantworten
Warum sollten empirische Quantile für nicht definiert sein? Siehe Empirisches Quantil#Definition: Für und ist nicht ganzzahlig, also gilt . -- HilberTraum (d, m) 20:11, 18. Sep. 2019 (CEST)Beantworten
Jacke2042,HillErtRaum: Zur Abgrenzung von Quantil (Wahrscheinlichkeitstheorie) zu Empirisches Quantil finde ich die umseitige Einleitung nicht sehr gelungen:
Quantile formalisieren praktische Aussagen wie „25 % aller Frauen sind kleiner als 1,62 m“ – wobei 1,62 m hier das 25-%-Quantil ist. Eine bekannte Darstellung und Veranschaulichung einer Quantilfunktion aus der Ökonometrie ist die Parade der Einkommen (Pen’s Parade) des Ökonomen Jan Pen zur Einkommensverteilung. 
Die zwei Beispiele finde ich schlecht gewählt. Ich als Nicht-Statistiker habe mir gemerkt: das eine Quartil rechnet mit Messwerten (Stichproben), das andere Quartile rechnet mit Dichtefunktionen (die vom Himmel fallen). Sowohl die Größenverteilungen von Frauen als auch die Einkommensverteilungen in Form der Parade sind Stichproben, also Messwerte, die man aus einer grundgesamten Population erheben kann. Sollte man daher nicht besser die Beispiele in den Schwesterartikel rüberschieben und sich Beispiele ausdenken, bei der man mit fest vorgegebenen Wahrscheinlichkeitsverteilungen rechnet - weniger mit empirischer Praxis? Wie wäre es mit einer logistischen Verteilung oder etwas ähnlichem? Einem idealen Würfel- oder Kartenspiel? --Gunnar (Diskussion) 23:12, 5. Mär. 2021 (CET)Beantworten
Ich habe Pens Parade zu empirisches Quantil verschoben. --Sigma^2 (Diskussion) 09:24, 27. Sep. 2023 (CEST)Beantworten

Rezension[Quelltext bearbeiten]

Der Artikel “Quantil” erläutert kurz und prägnant den Begriff und beschreibt dabei einige Spezialfälle des Lageparameters, wie z.B. Median, Quartil, etc.. Als Letztes wird ein Beispiel angegeben, wo das p-Quantil nochmal angewendet wird.

Die Einleitung beginnt mit einer kurzen Beschreibung der Idee bzw. des Konzeptes des Quantils. Aus meiner Sicht scheint diese Erklärung das Konzept gut zu übermitteln, aber an einer Stelle zu ungenau zu sein. So wird beschrieben, dass p eine Zahl zwischen 0 und 1 sei. Dies kann aber zur Verwirrung beitragen, da intuitiv nicht sofort jedem klar wird, ob p auch die Werte 0 und 1 annehmen kann (natürlich für Fachleute eindeutig zu sehen, aber für “normale” Leser eher weniger). Unter anderem wäre ein bessere Variante: “Ein p-Quantil ist ein Lagemaß in der Statistik, wobei p eine reelle Zahl mit 0<p<1 ist.”

Im folgenden Abschnitt wird der Begriff nun näher definiert. Zuerst wird das p-Quantil ausführlich ausformuliert, während es im letzten Absatz mathematisch exakt definiert wird. Hier zeigen sich meiner Meinung nach die größten Schwächen des Artikels. Die Definitionen sind einfach zu verstehen und werden anschaulich dargestellt. Allerdings würde ich diesen Abschnitt um folgende Informationen ergänzen:

  • vorliegende Daten/Fälle sind nach der Größe geordnet
  • Formeln zur Berechnung der Quantile
  • dabei Differenzierung zwischen statistischen Variablen und Zufallsvariablen,

diskret und stetig, ebenso auch für Fälle von klassierten Daten

Im nächsten Abschnitt werden nun besondere Quantile angegeben und kurz beschrieben. Diese Spezialfälle werden gut erklärt und auch einige weitere nützliche Informationen werden angegeben. Einziger Änderungspunkt wäre vielleicht, den (Inter-)Quartilsabstand deutlicher hervorzuheben. Dieser wird in dem Unterabschnitt “Quartil” leicht versteckt angegeben. Da der Quartilsabstand aber ein Streuungsparamter ist, sollte dieser auch besser kenntlich gemacht werden. Zusätzlich kann man dazu schreiben, dass dies ein robuster Parameter ist und zur Vollständigkeit den Quartilsdispersionskoeffizient angeben.

Im letzten Abschnitt wird ein einfaches Beispiel angegeben, womit die Begriffe nochmal wiederholt werden. Dieses ist für jedermann verständlich. Sollten aber im Abschnitt Definition einige Formeln hinzugefügt werden, so sollte noch ein Rechenbeispiel hinzugezogen werden.

Als Letztes wären zur Veraunschaulichung sicher noch weitere Graphen (wie z.B. Verteilungsfunktionen von klassierten Daten, Histogramme, etc.) nützlich, wo die jeweiligen Quantile eingezeichnet werden.

Zusammenfassend ist der Artikel eine gute kurze Einführung in die Thematik, der aber speziell für Statistiker leider noch etwas zu oberflächlich ist. --Spuppe 19:00, 5. Jul. 2011 (CEST)Beantworten

gudn tach!
dass im in der einleitung nur a zwischen b und c steht, hat vermutlich den hintergrund, dass der schreiber der einleitung eine moeglichst einfache formulierung (ohne mathematische formeln) waehlen wollte, aber ich stimme dir zu, dass man das "<"-zeichen dem leser dieses artikels zutrauen sollte.
auch in den restlichen vorschlaegen sehe ich verbesserungen. traust du dir denn zu, diese aenderungen durchzufuehren? brauchst du wiki-technische unterstuetzung? -- seth 11:04, 10. Jul. 2011 (CEST)Beantworten

der Wert selbst[Quelltext bearbeiten]

der Einleitungstext ist nicht erhellend: "Links vom p-Quantil liegen 100 * p Prozent aller Beobachtungswerte ... Rechts davon liegen 100 * (1-p) Prozent aller Beobachtungswerte" dies kann nicht sein, wenn der Wert selbst auf genau eine Ausprägung fallen soll, denn "linksdavon + der Wert selbst + rechtsadvon" gäbe sonst mehr als 100%

Es wird eine definitive Aussage benötigt, wohin die Merkmalsausprägung selbst gehört. Es reicht nicht aus, wenn man/frau Unterschreitungswahrscheinlichkeit fett schreibt. Noch verwirrender wird es, wenn man dem bereits o.g. Link http://files.hanser.de/geiger/20050204_25249414-87_TerminusTechnicus_Vorstudie_2005_01.pdf folgt. Die dort aufgeführten Definitionen überbieten sich ja geradezu, genau diesen Punkt zu verschleiern: Beispiel " ...Merkmalswert unter dem (diesen eingeschlossen) ..." ja was denn nun kleiner gleich ODER kleiner?

Ebenfalls ist die Formulierung " ... Wert bei dem springt ..." da der Wert immer davon abhängt von welche Seite man aus dies betrachtet. (nicht signierter Beitrag von 131.220.35.83 (Diskussion) 14:41, 22. Sep. 2011 (CEST)) Beantworten

Hallo alle zusammen,
Das, was die IP hier 2011 geschrieben hat, ist dann richtig, wenn von empirischen Quantilen ausgegangen wird, dann aber nicht ein Problem in der Formulierung, sondern eines in der Sache selbst.
bei nichtdiskreten theoretischen Verteilungen wie der Normalverteilung sind die Werte auf der x-Achse reelle Zahlen. Deshalb kann in diesem Fall immer ein exakter Punkt auf der x-Achse angegeben werden, der die Verteilung in einen Bereich unterhalb (=»links«) von diesem Punkt, der einen Anteil an der Verteilung von p () beinhaltet, und einen Bereich oberhalb (=»rechts«) von diesem Punkt, der einen Anteil an der Verteilung von 1–p beinhaltet, teilt. Bei der Standardnormalverteilung wäre das ein z-Wert.
Bei empirischen Verteilungen gibt es aber immer nur ganze Fälle bzw. Datensätze. Deshalb ist hier das Quantil ein Wert (Variablenausprägung), den entweder ein bestimmter Fall aufweist oder der zwischen zwei Fällen liegt und dann auf die eine oder andere Weise interpoliert werden muss. Wenn es sich um einen real existierenden Fall handelt, dann entsteht immer die Frage der Zuordnung: wird der Wert dieses Falls zum Unterschreiungsanteil, zum Überschreitungsanteil, zu beiden oder zu keinem der beiden gezählt? Wie sich im englischen Wikipedia-Artikel »Quartile« nachlesen lässt, hat das zu durchaus unterschiedlichen Lösungen geführt. Auch Tabellenkalkulationen bieten unterschiedliche Ansätze an. In jedem Fall sind empirische Quantile immer nur eine Annäherung an theoretische Quantile. Vielleicht sollte dieser Punkt in beiden Artikeln (Empirisches Quantil, Quantil (Wahrscheinlichkeitstheorie)) besser heausgearbeitet werden.
Viele Grüße
--Jake2042 (Diskussion) 03:12, 18. Sep. 2019 (CEST)Beantworten

Unklare Ergebnisse für die Beispiele zur Berechnung empirischer Quantile[Quelltext bearbeiten]

Also meines Erachtens kommt beim ersten Beispiel des Abschnitts als Ergebnis für das Quantile und im zweiten Beispiel raus. Warum wurde hier ab- bzw. aufgerundet auf ganze Zahlen? Sollte man die Ergebnisse korrigieren? (nicht signierter Beitrag von Normanski (Diskussion | Beiträge) 11:58, 3. Feb. 2012 (CET)) Beantworten

gudn tach!
wie kommst du auf 2,4? wie lautet deine rechnung? -- seth 21:57, 13. Feb. 2012 (CET)Beantworten

Hi, bei der Formel scheint mir auch ein Fehler zu sein. Die Runden Klammern nach dem 1/2 sollten durch Abrundunksklammern ersetzt werden, so wie in http://books.google.de/books?id=23WegW6oZm4C&lpg=PA118&dq=empirisches+quantil&hl=de&pg=PA118&redir_esc=y#v=onepage&q=empirisches%20quantil&f=false --188.194.91.101 11:51, 12. Jul. 2013 (CEST)Beantworten

Definition von Quantil[Quelltext bearbeiten]

Lieber Autor, liebe Autorin,

mir scheint die beiden Absätze

(1) Genauer ist das p-Quantil.. (2) Als Quantil der Ordnung p..

definieren das selbe und sind redundant.

Die Zuweisungen p := p * 100% 1-p := (1-p) * 100%

finde ich überflüssig und eher verwirrend. Herzliche Grüße (nicht signierter Beitrag von 188.174.126.28 (Diskussion) 10:48, 1. Apr. 2014 (CEST))Beantworten

Abweichende Terminologie[Quelltext bearbeiten]

In einigen Anwendungsbereichen findet sich eine abweichende Terminologie. Es werden dann nicht die vier Stellen, welche die Verteilung in fünf gleichgroße Teile aufteilen, Quintile genannt, sondern die fünf entstehenden Teile der Verteilung. Diese Verwendung findet sich insbesondere im Zusammenhang mit Einkommensverteilungen. Belege:

  • "Einkommensverteilungen lassen sich u.a. durch Verteilungsquantile beschreiben. Ein Quantil ist ein bestimmter Prozentanteil von Erhebungseinheiten und stellt damit einen Teilabschnitt der Einkommensverteilung dar. Quantile können z. B. Quartile sein (25 %), Quintile (20 %) oder auch Dezile (10 %)." "Jedes Verteilungsquintil enthält 20 % der nach Einkommenshöhe sortierten Folge der Erhebungseinheiten, wobei der Anteil, den diese Einheiten zum Gesamteinkommen beitragen, je nach Quintil unterschiedlich groß ist." Statistisches Bundesamt, S.14
  • Im Urteil des Bundesverfassungsgerichtes vom 9. Februar 2010 - 1BvL 1/09 - wird wiederholt der Begriff "unterstes Quintil" für die unteren 20 Prozent der Einkommensverteilung verwendet.
  • Bei eurostat gibt es eine Einkommensverteilung nach Quantilen, bei der es vier Quartile, fünf Quintile, zehn Dezile und 100 Perzentile gibt.
  • Eine Internetsuche nach "Einkommensquintil" produziert hunderte von Treffern, bei denen ein Einkommensquintil einen Teil der Einkommensverteilung bezeichnet und kein Quintil im Sinn der statistischen Definition bezeichnet.

--Statist42 (Diskussion) 10:34, 12. Mär. 2015 (CET)Beantworten

Das ist ein wichtiger Punkt, der in den Artikel Empirisches Quantil sollte.--Sigma^2 (Diskussion) 00:15, 20. Sep. 2023 (CEST)Beantworten

Besondere Quantile[Quelltext bearbeiten]

Die verbalen Erläuterungen in diesem Abschnitt beziehen sich teilweise auf empirische Quantile und nicht auf Quantile einer Wahrscheinlichkeitsverteilung. Die zwei unverständlichsten Sätze habe ich auskommentiert. Der Rest müsste überarbeitet werden. --Sigma^2 (Diskussion) 11:39, 27. Sep. 2021 (CEST)Beantworten

Es gibt zwei Konzepte: Quantile einer Wahrscheinlichkeitsverteilung und empirische Quantile (Quantile einer Stichprobe, Quantile einer empirischen Verteilung). Im Abschnitt Definition ist das Konzept des Quantils einer Wahrscheinlichkeitsverteilung beschrieben, aber in den verbalen Teilen mäandert der Text zwischen den beiden Konzepten hin und her. --Sigma^2 (Diskussion) 09:50, 30. Sep. 2021 (CEST)Beantworten

Linksseitiger Grenzwert bei der Definition via Verteilungsfunktion[Quelltext bearbeiten]

Warum sollte das der linksseitige Grenzwert sein und nicht der rechtsseitige? Bei meiner Herleitung ende ich immer mit dem rechtsseitigen Grenzwert. Gibt es eine Quelle für diese Definition? --134.2.107.227 14:11, 19. Sep. 2023 (CEST)Beantworten

Ein p-Quantil ist definiert als eine Stelle mit und . Die Verteilungsfunktion von ist die Funktion .
Erste Bedingung: Es gilt
Zweite Bedingung: Es gilt
Somit gilt
Das sind so elementare Umformungen, dass keine Quelle erforderlich ist.
Der rechtsseitige Grenzwert einer Verteilungsfunktion an einer Stelle ist der Wert der Verteilungsfunktion an der Stelle , d. h. es gilt
da die Verteilungsfunktion rechtsseitig stetig ist.
Wie sieht denn Deine Herleitung aus, die zum rechtsseitigen Grenzwert führt? --Sigma^2 (Diskussion) 23:29, 19. Sep. 2023 (CEST)Beantworten