Median-Regression
Die Methode der kleinsten absoluten Abweichungen, auch Median-Regression, stellt ein robustes Schätzverfahren dar, um unbekannte Parameter einer linearen Regression zu schätzen. Solch ein Schätzer wird Kleinste-Absolute-Abweichungen-Schätzer (engl. least absolute deviations estimator, LAD) genannt. Bei dieser Methode wird die Summe der absoluten Abweichungen minimiert, im Unterschied zur Methode der kleinsten Quadrate, bei der die Summe der quadrierten Abweichungen minimiert wird. Die Median-Regression ist ein Spezialfall der Quantilsregression, bei der im Allgemeinen die Beträge der positiven und negativen Abweichungen unterschiedlich gewichtet werden; bei Gleichgewichtung ergibt sich die Median-Regression.
Geschichte
[Bearbeiten | Quelltext bearbeiten]Die Methode der kleinsten absoluten Abweichungen ist historisch gesehen älter als die Methode der kleinsten Quadrate. Sie wurde zuerst um 1760 von Rugjer Josip Bošković (1711–1787) vorgeschlagen.[1] In moderner Terminologie wird dieser Ansatz als Median-Regression bezeichnet, da in einem stochastischen Regressionsmodell das Resultat der Minimierung zu einem Schätzer für den Median der abhängigen Variablen bei gegebenen Werten der unabhängigen Variablen führt.[1] Die Median-Regression ist ein Spezialfall der Quantilsregression[2], wobei der Median das bei der Quantilsregression verwendete Quantil ist.
Verfahren
[Bearbeiten | Quelltext bearbeiten]Statt die Summe der quadrierten Abweichung zu minimieren, wird die Summe der absoluten Abweichungen
bzgl. minimiert. Dabei bezeichnet die Anzahl der Beobachtungen und die Anzahl der Regressionskoeffizienten, die im -Vektor zusammengefasst sind. Die Werte des Regressanden (der erklärten Variablen) sind und die -Vektoren für enthalten die Werte der Regressoren (der erklärenden Variablen). Im Fall für liegt eine Regression mit Absolutglied vor.
Eine Minimalstelle , d. h. ein Vektor
- ,
ist ein geschätzter Parametervektor.
Das Minimierungsproblem kann als Aufgabe der linearen Programmierung formuliert werden und bspw. mit dem Simplex-Verfahren gelöst werden.
Beispiel und einfachster Spezialfall
[Bearbeiten | Quelltext bearbeiten]Der einfachste Spezialfall ergibt sich für , und einen konstanten Regressor mit für . Die Minimierung von bzgl. für fixierte y-Werte, d. h. die Anwendung der Methode der kleinsten Quadrate, führt dann zur Minimalstelle
d. h. zum arithmetischen Mittelwert der y-Werte. Die Minimierung von bzgl. für fixierte y-Werte führt dazu, dass jeder Median der y-Werte eine Minimalstelle ist, also
erfüllt. Ein Median ist in diesem Zusammenhang jede Stelle , für die zugleich
gilt. Beispielsweise ist für und jeder Wert im Intervall ein Median. Im Unterschied zur Methode der kleinsten Quadrate ist bei der Minimierung der absoluten Abstände die Eindeutigkeit der Minimalstelle nicht garantiert.
Literatur
[Bearbeiten | Quelltext bearbeiten]- Ludwig Fahrmeir, Thomas Kneib, Stefan Lang, Brian D. Marx: Regression – Models, Methods and Applications. Springer, Berlin / Heidelberg 2013, ISBN 978-3-642-34332-2, doi:10.1007/978-3-642-34333-9 (E-Book-ISBN 978-3-642-34333-9).