Pseudo-Bestimmtheitsmaß

Für allgemeine Regressionsmodelle deren Parameter durch Maximum-Likelihood-Schätzung gefunden werden, lassen sich verschiedene Pseudo-Bestimmtheitsmaße (notiert als ${\text{Pseudo-R}}^{2}$ ) definieren, die auf der Likelihoodfunktion basieren.

Motivation[Bearbeiten | Quelltext bearbeiten]

Im Falle einer linearen Regression beschreibt das Bestimmtheitsmaß den erklärten Anteil der Variabilität (Varianz) einer abhängigen Variablen $Y$ durch ein statistisches Modell. Bei einem nominalen oder ordinalen Skalenniveau von $Y$ (z. B. bei Klassifikationen) existiert jedoch kein Äquivalent, da man die Varianz und damit ein $\mathrm {R^{2}}$ nicht berechnen kann.

Das Pseudo-Bestimmtheitsmaß[Bearbeiten | Quelltext bearbeiten]

Pseudo-Bestimmtheitsmaße sind so konstruiert, dass sie den verschiedenen Interpretationen (z. B. erklärte Varianz, Verbesserung gegenüber dem Nullmodell oder als Quadrat der Korrelation) des Bestimmtheitsmaßes genügen. Sie sind dem $\mathrm {R^{2}}$ in der Hinsicht ähnlich, dass dessen Werte ebenfalls im Intervall von 0 und 1 liegen und ein höherer Wert einer besseren Anpassung des Modells an die Daten entspricht.

Likelihood-basierte Maße[Bearbeiten | Quelltext bearbeiten]

Maddalas / Cox & Snells Pseudo-R²[Bearbeiten | Quelltext bearbeiten]

\mathrm {R_{Maddala}^{2}} =1-\left({\frac {L_{0}}{L_{1}}}\right)^{2/n}

,

mit

L_{0}

: Nullmodell,

L_{1}

: Modell mit erklärenden Variablen

\mathrm {R_{Maddala}^{2}} \in [0,1)

Vergleicht das Verhältnis der Werte $L_{0}$ der Wert der Likelihood-Funktion, in dem die völlige Unabhängigkeit aller Variablen angenommen wird (Nullmodell oder Leermodell) und $L_{1}$ der Likelihood-Funktionen unter Kenntnis des Zusammenhanges zwischen $Y$ und $X_{i}$ (volles Regressionsmodell). Je geringer dieses Verhältnis, desto größer die Verbesserung des ganzen Modells gegenüber dem Nullmodell. Maddalas ${\text{Pseudo-R}}^{2}$ kann auch bei perfekter Vorhersage nie den Wert 1 erreichen.

Nagelkerkes / Cragg & Uhlers Pseudo-R²[Bearbeiten | Quelltext bearbeiten]

\mathrm {R_{Nagelkerke}^{2}} ={\frac {1-\left({\frac {L_{0}}{L_{1}}}\right)^{2/n}}{1-L_{0}^{2/n}}}

,

mit

L_{0}

: Nullmodell,

L_{1}

: Modell mit erklärenden Variablen

\mathrm {R_{Nagelkerke}^{2}} \in [0,1]

Nagelkerkes Pseudo-R² erweitert Maddalas Pseudo-R², sodass durch eine Reskalierung ein möglicher Wert von 1 erreicht werden kann, wenn das vollständige Modell eine perfekte Vorhersage mit einer Wahrscheinlichkeit von 1 trifft.

Nagelkerke gab auch allgemeine Bedingungen für ein Pseudo-Bestimmtheitsmaß an:

Ein Pseudo-Bestimmtheitsmaß sollte mit dem Bestimmtheitsmaß $\mathrm {R^{2}}$ übereinstimmen, wenn beide berechnet werden können.
Es sollte ebenfalls mit der Maximum-Likelihood-Schätzung des Modells maximiert werden.
Es sollte, zumindest asymptotisch, unabhängig vom Stichprobenumfang sein.
Die Interpretation sollte die durch das Modell erklärte Variabilität von $Y$ sein.
Es sollte zwischen Null und Eins liegen. Bei einem Wert von Null sollte es keine Aussage über die Variabilität von $Y$ machen; bei einem Wert von Eins, sollte es die Variabilität von $Y$ vollständig erklären.
Es sollte keine Maßeinheit besitzen.

Log-Likelihood-basierte Maße[Bearbeiten | Quelltext bearbeiten]

McFadden R²[Bearbeiten | Quelltext bearbeiten]

\mathrm {R_{McFadden}^{2}} =1-{\frac {\ln L_{1}}{\ln L_{0}}}=1-{\frac {D_{1}}{D_{0}}}

,

mit

L_{0}

: Nullmodell,

L_{1}

: Modell mit erklärenden Variablen

D_{i}

die Devianz (Statistik) der entsprechenden Modelle^[1]

\mathrm {R_{McFadden}^{2}} \in [0,1)

Das Verhältnis der logarithmierten der Werte $L_{1}$ und $L_{0}$ der Likelihood-Funktion (Wahrscheinlichkeiten) spiegelt den Grad der Verbesserung des vollständigen Modells mit Prädiktoren gegenüber dem Nullmodell wider. Ein Modell mit einem größeren McFaddens hat eine bessere Anpassung gegenüber einem anderen Modell mit einem geringeren Wert.

Daumenregel: Bereits $0{,}2<\mathrm {R_{McFadden}^{2}} <0{,}4$ stellt ein besonders gute Anpassung des Modells dar.^[2]

McFaddens korrigiertes R²[Bearbeiten | Quelltext bearbeiten]

\mathrm {R_{McFadden_{korr.}}^{2}} =1-{\frac {\ln L_{1}-K}{\ln L_{0}}}

Das korrigierte McFaddens bewertet die Anzahl der Prädiktoren $K$ für die Anpassungsgüte eines Modells. Ähnlich dem korrigierten Bestimmtheitsmaß ${\bar {\mathrm {R} }}^{2}$ verringern zu viele Prädiktoren, die dem Modell nicht genügend beitragen, die Effektivität eines Modells und schlagen sich negativ im korrigierten McFaddens ${\text{Pseudo-R}}^{2}$ nieder. Somit sind Werte kleiner 0 möglich.

Aldrich / Nelsons R²[Bearbeiten | Quelltext bearbeiten]

\mathrm {R_{AldrichNelson}^{2}} =1-{\frac {2\cdot (\ln L_{1}-L_{0})}{2\cdot (\ln L_{1}-L_{0})+c\cdot n}}

, c = 1 (Probit-Modell), 3,29 (Logit-Modell)

\mathrm {R_{AldrichNelson}^{2}} \in [0,1)

Aldrich / Nelsons setzt den Likelihood-Quotienten ins Verhältnis, der die Rate von Nullmodell und Alternativmodell bei eingetretenem Ereignis angibt. Es hat eine obere Grenze von weit unter 1.

Korrelations-basierte Maße[Bearbeiten | Quelltext bearbeiten]

Lave / Efrons R²[Bearbeiten | Quelltext bearbeiten]

\mathrm {R_{Lave}^{2}} =1-{\frac {\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}(Y_{i}-{\hat {P}}_{i})^{2}}{\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}(Y_{i}-{\bar {Y}})^{2}}}

Lave / Efrons kann man ähnlich dem normalen Bestimmtheitsmaß als Quadrat der Korrelation und als erklärte Variabilität interpretieren. Es werden die quadrierten Residuen aufsummiert, wobei ${\hat {P}}_{i}$ eine vom Modell vorhergesagte Wahrscheinlichkeit für $Y_{i}=1$ ist, welche die diskrete abhängige Variable in eine stetige überführt (Hinweis: $Y_{i}$ kann nur die Werte 0 und 1 annehmen).

Auf der erklärten Variation basierend[Bearbeiten | Quelltext bearbeiten]

McKelvey & Zavoinas R²[Bearbeiten | Quelltext bearbeiten]

\mathrm {R_{McKelvey}^{2}} ={\frac {{\widehat {\operatorname {Var} }}({\hat {y}}^{*})}{{\widehat {\operatorname {Var} }}({\hat {y}}^{*})+\operatorname {Var} (e)}}

\mathrm {R_{McKelvey}^{2}} \in [0,1]

McKelvey & Zavoinas ist strukturell dem normalen Bestimmtheitsmaß nachempfunden. Es wird die geschätzte erklärte Quadratsumme der Regression mit der geschätzten erklärten und unerklärten Quadratsumme von Regression und Fehler ins Verhältnis gesetzt.

Vergleichbarkeit[Bearbeiten | Quelltext bearbeiten]

Die Werte der verschiedenen Pseudo-Bestimmtheitsmaße können innerhalb eines Modells stark variieren. Somit können unterschiedliche Maße zwischen verschiedenen Datensätzen nicht miteinander verglichen und unabhängig interpretiert werden. Als beste Approximation hat sich McKelvey & Zavoinas erwiesen^[3]; Laves, McFaddens, Nagelkerkes unterschätzen das "wahre" $\mathrm {R^{2}}$ einer Kleinste-Quadrate-Schätzung für ein Modell mit latenten Variablen stark.

Beispiel[Bearbeiten | Quelltext bearbeiten]

Ein Wäscheklammerproduzent möchte seine neuartigen Wäscheklammern auf den Markt bringen und deswegen vorab die Wahrscheinlichkeit eines Kaufes berechnen. Er berät sich mit seinem Geschäftspartner, der ein Statistikprogramm besitzt. Dieser nimmt an, dass der Kauf nur von einem Attribut abhängt, dem Preis $X_{\text{Preis}}$ . Der aggregierte Einfluss auf die Kaufentscheidung soll eine lineare Beziehung haben, $Z=b_{0}+b_{1}\cdot X_{\text{Preis}}$ , auch Logit genannt. Der Wäscheklammerproduzent hingegen glaubt eher, dass die Kaufabsicht vom Preis, der Farbe und der Größe abhängt: $Z=b_{0}+b_{1}\cdot X_{\text{Preis}}+b_{2}\cdot Y_{\text{Farbe}}+b_{3}\cdot W_{\text{Größe}}$ . Mittels Marktforschungsdaten sind die Regressionsparameter $b_{0}$ , $b_{1}$ , $b_{2}$ und $b_{3}$ nach der Maximum-Likelihood-Schätzung vom Computer iterativ ermittelt worden. Allerdings fragt sich nun der Wäscheklammerproduzent, welche Modellhypothese die Realität besser wiedergibt und auf welche man weitere Überlegungen stützen sollte. Zur Einschätzung der Anpassungsgüte der angenommenen Modelle an die vorhandenen Daten sollen verschiedene Pseudo-Bestimmtheitsmaße benutzt werden. Diese lassen sich die beiden Geschäftspartner vom Statistikprogramm ausgeben.

Maße der Anpassungsgüte	Modell 1 ( $b_{0},b_{1}$ )	Modell 2 ( $b_{0},b_{1},b_{2},b_{3}$ )
${\text{Pseudo-R}}^{2}$
McFadden R²	0,307	0,445
McFadden Adj R²	0,273	0,389
Cragg-Uhler (Nagelkerke) R²	0,436	0,578
McKelvey & Zavoina R²	0,519	0,643
Efron / Lave R²	0,330	0,472

Da die Pseudo-Bestimmtheitsmaße für Modell 2 durchweg höher sind, d. h., dass dieses Modell die Marktforschungsdaten besser abbildet, entscheidet man sich für dieses und schätzt damit die Kaufwahrscheinlichkeit bzw. den möglichen Marktanteil.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Devianz (Statistik)

Weblinks[Bearbeiten | Quelltext bearbeiten]

FAQ: What are pseudo R-squareds?

Literatur[Bearbeiten | Quelltext bearbeiten]

Cragg, J.G., Uhler, R. (1970), "The Demand for Automobiles", Canadian Journal of Economics 3, S. 386–406, JSTOR:133656.
Hagle, T. M., Mitchell II, G. E. (1992), "Goodness-of-Fit Measures for Probit and Logit", American Journal of Political Science 36, S. 762–784, JSTOR:2111590.
McFadden, D. (1973), "Conditional Logit Analysis of Qualitative Choice Behavior" (PDF 1,77 MB), in: P. Zarembka (ed.) Frontiers in Econometrics, Academic Press: New York, ISBN 0-12-776150-0, S. 105–142.
McKelvey, R., Zavoina, W. (1975), "A Statistical Model for the Analysis of Ordinal Level Dependent Variables", Journal of Mathematical Sociology 4, S. 103–120, doi:10.1080/0022250X.1975.9989847.
Nagelkerke, N. J. D. (1991), "A Note on a General Definition of the Coefficient of Determination", Biometrika 78, Nr. 3, S. 691–692, doi:10.1093/biomet/78.3.691.
Veall, M. R., Zimmermann, K. F. (1996), "Pseudo-R² Measures for Some Common Limited Dependent Variable Models", Sonderforschungsbereich 386, Paper 18, doi:10.5282/ubm/epub.1421.

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

↑ Wolfgang Langer: Mehrebenenanalyse. Springer-Verlag, 2008, ISBN 3-531-15685-3 S. 120 (eingeschränkte Vorschau in der Google-Buchsuche)
↑ Jordan J. Louviere: Stated choice methods : analysis and applications. Cambridge 2000, ISBN 0-511-01172-5, S. 54.
↑ Veall, Zimmermann (1996), "Pseudo-R² Measures for Some Common Limited Dependent Variable Models", Sonderforschungsbereich 386, Paper 18.

[1] Wolfgang Langer: Mehrebenenanalyse. Springer-Verlag, 2008, ISBN 3-531-15685-3 S. 120 (eingeschränkte Vorschau in der Google-Buchsuche)

[2] Jordan J. Louviere: Stated choice methods : analysis and applications. Cambridge 2000, ISBN 0-511-01172-5, S. 54.

[3] Veall, Zimmermann (1996), "Pseudo-R² Measures for Some Common Limited Dependent Variable Models", Sonderforschungsbereich 386, Paper 18.

[1]

[2]

[3]

Pseudo-Bestimmtheitsmaß

Inhaltsverzeichnis

Motivation[Bearbeiten | Quelltext bearbeiten]

Das Pseudo-Bestimmtheitsmaß[Bearbeiten | Quelltext bearbeiten]

Likelihood-basierte Maße[Bearbeiten | Quelltext bearbeiten]

Maddalas / Cox & Snells Pseudo-R²[Bearbeiten | Quelltext bearbeiten]

Nagelkerkes / Cragg & Uhlers Pseudo-R²[Bearbeiten | Quelltext bearbeiten]

Log-Likelihood-basierte Maße[Bearbeiten | Quelltext bearbeiten]

McFadden R²[Bearbeiten | Quelltext bearbeiten]

McFaddens korrigiertes R²[Bearbeiten | Quelltext bearbeiten]

Aldrich / Nelsons R²[Bearbeiten | Quelltext bearbeiten]

Korrelations-basierte Maße[Bearbeiten | Quelltext bearbeiten]

Lave / Efrons R²[Bearbeiten | Quelltext bearbeiten]

Auf der erklärten Variation basierend[Bearbeiten | Quelltext bearbeiten]

McKelvey & Zavoinas R²[Bearbeiten | Quelltext bearbeiten]

Vergleichbarkeit[Bearbeiten | Quelltext bearbeiten]

Beispiel[Bearbeiten | Quelltext bearbeiten]

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Navigationsmenü

Pseudo-Bestimmtheitsmaß

Motivation[Bearbeiten | Quelltext bearbeiten]

Das Pseudo-Bestimmtheitsmaß[Bearbeiten | Quelltext bearbeiten]

Likelihood-basierte Maße[Bearbeiten | Quelltext bearbeiten]

Maddalas / Cox & Snells Pseudo-R2[Bearbeiten | Quelltext bearbeiten]

Nagelkerkes / Cragg & Uhlers Pseudo-R2[Bearbeiten | Quelltext bearbeiten]

Log-Likelihood-basierte Maße[Bearbeiten | Quelltext bearbeiten]

McFadden R2[Bearbeiten | Quelltext bearbeiten]

McFaddens korrigiertes R2[Bearbeiten | Quelltext bearbeiten]

Aldrich / Nelsons R2[Bearbeiten | Quelltext bearbeiten]

Korrelations-basierte Maße[Bearbeiten | Quelltext bearbeiten]

Lave / Efrons R2[Bearbeiten | Quelltext bearbeiten]

Auf der erklärten Variation basierend[Bearbeiten | Quelltext bearbeiten]

McKelvey & Zavoinas R2[Bearbeiten | Quelltext bearbeiten]

Vergleichbarkeit[Bearbeiten | Quelltext bearbeiten]

Beispiel[Bearbeiten | Quelltext bearbeiten]

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Navigationsmenü

Suche

Maddalas / Cox & Snells Pseudo-R²[Bearbeiten | Quelltext bearbeiten]

Nagelkerkes / Cragg & Uhlers Pseudo-R²[Bearbeiten | Quelltext bearbeiten]

McFadden R²[Bearbeiten | Quelltext bearbeiten]

McFaddens korrigiertes R²[Bearbeiten | Quelltext bearbeiten]

Aldrich / Nelsons R²[Bearbeiten | Quelltext bearbeiten]

Lave / Efrons R²[Bearbeiten | Quelltext bearbeiten]

McKelvey & Zavoinas R²[Bearbeiten | Quelltext bearbeiten]