Bestimmtheitsmaß
aus Wikipedia, der freien Enzyklopädie
Das Bestimmtheitsmaß (abk. , auch Determinationskoeffizient) ist ein Maß der Statistik für den Anteil der erklärten Varianz eines Zusammenhangs.
- Interpretationsbeispiel: Beträgt es für zwei Variablen und beispielsweise , dann heißt dies, dass die Hälfte (50%) der Streuung von durch lineare Abhängigkeit von erklärt werden kann.
Inhaltsverzeichnis |
[Bearbeiten] Das (unbereinigte) Bestimmtheitsmaß
Das Bestimmtheitsmaß wird oft mit abgekürzt. liegt zwischen
- 0 (kein linearer Zusammenhang: das Regressionsmodell besteht nur aus einer Konstanten) und
- 1 (exakter linearer Zusammenhang: alle Fehlerterme sind Null).
Es gibt an, in welchem Maße die Varianz einer Variablen durch die Varianz einer anderen Variablen bestimmt wird.
Einfachregression: Es entspricht bei einfachen Regressionen dem Quadrat des Pearson'schen Korrelationskoeffizienten und lässt sich aus der Kovarianz und den Einzelvarianzen berechnen:
Multiple Regression: Bei multiplen Regressionen entspricht das der Wurzel aus dem multiplen Korrelationskoeffizienten und wird wie folgt berechnet:
- wobei die Summe der quadrierten Regressionswerte darstellt. Diese wird als die durch die Regression erklärte Variabilität interpretiert.
- ist die Summe der quadrierten Residuen (residual sum of squares), diese wird als die nicht erklärte Variabilität gedeutet.
- stellt die Summe der quadrierten Beobachtungen (total sum of squares) dar. Diese wird als die totale Variabilität interpretiert.
Aus der ersten Gleichung zu erkennt man, dass das Verhältnis von erklärter Variabilität und totaler Variabilität darstellt. Falls somit sehr nahe bei 1 liegt, dann liegt die erklärte Variabilität sehr nahe bei der totalen Variabilität. Ferner gilt die Streuungszerlegung
[Bearbeiten] Kritik
- Das Bestimmtheitsmaß zeigt zwar die Qualität der linearen Approximation, jedoch nicht, ob das Modell richtig spezifiziert wurde. Modelle, die mittels kleinster Quadrate geschätzt wurden, werden daher die höchsten erhalten.
- Außerdem sagt es nichts über die statistische Signifikanz des ermittelten Zusammenhangs und der einzelnen Regressoren aus. Dazu muss zusätzlich ein Signifikanztest durchgeführt werden.
- Ein weiterer Nachteil liegt in der Empfindlichkeit gegenüber Trends: Sofern sich eine exogene Variable parallel zu einer erklärenden entwickelt, werden unabhängig von der wahren Erklärungskraft des Modells hohe ausgewiesen.
[Bearbeiten] Das angepasste Bestimmtheitsmaß
Das Bestimmtheitsmaß birgt verschiedene Probleme, von daher ist es ratsam auch das bereinigte oder angepasste Bestimmtheitsmaß zu Rate zu ziehen.
Hierbei gibt
- die Anzahl der Daten und
- die Anzahl der unbekannten Parameter an.
Ein Problem des nichtangepassten Bestimmtheitsmaßes ist, dass dieses bei Hinzufügen eines weiteren, aber evtl. ungeeigneten Regressors, nicht kleiner werden kann. Das angepasste Bestimmtheitsmaß steigt dagegen nur, falls ausreichend steigt, um den gegenläufigen Effekt des Quotienten auszugleichen und kann auch sinken. Auf diese Weise lässt sich als Entscheidungskriterium bei der Auswahl zwischen zwei alternativen Modellspezifikationen (etwa einem restringierten und einem unrestringierten Modell) verwenden.
[Bearbeiten] Vergleich: Unbereinigtes und bereinigtes Bestimmtheitsmaß
Das unbereinigte Bestimmtheitsmaß hat zudem die nicht erwünschten Eigenschaften, dass es
- mit steigender Varianz von steigt, ohne dass der Grad der Anpassung sich verbessert hat und
- mit dem Umfang der Stichprobe steigt.
Auch diese negativen Eigenschaften werden durch das bereinigte Bestimmtheitsmaß über den Korrekturfaktor ausgeglichen. Es wird von daher auch möglich Schätzungen mit unterschiedlichem Stichprobenumfang oder unterschiedlicher Varianz der Abhängigen Variablen miteinander zu vergleichen.
Das bereinigte Bestimmtheitsmaß kann auch negative Werte annehmen und ist kleiner als das unbereinigte, außer falls , dann ist auch .
[Bearbeiten] Pseudo-Bestimmtheitsmaß
Bei bestimmten statistischen Modellen, z.B. bei Maximum-Likelihood-Schätzungen, existiert das Bestimmtheitsmaß nicht. In solchen Modellen wird das sogenannte Pseudo-Bestimmtheitsmaß verwendet. Unter diesem Begriff wurden verschiedene Maße vorgeschlagen, darunter das unter Ökonomen am häufigsten verwendete von McFadden (mit aus dem Modell mit lediglich einer Konstanten):