Zufälliger Fehler

aus Wikipedia, der freien Enzyklopädie

Du hast neue Nachrichten (Unterschied zur vorletzten Version).

Die Artikel Fehler und Messfehler überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Die Diskussion über diese Überschneidungen findet hier statt. Bitte äußere dich dort, bevor du den Baustein entfernst. Chrisqwq 17:36, 26. Sep 2006 (CEST)

Als Zufällige oder Nicht-erklärte '(Mess-)fehler oder Abweichungen beizeichnet man in der Statistik die Streuung der Einzelmessungen neben der erklärten Abweichung, die aus dem angenommenen Modell heraus zu erklären ist. Im Allgemeinen darf unterstellt werden, dass der aktuelle Wert des zufälligen Fehlers durch Überlagerung mehrerer oder auch vieler in etwa gleichgroßer Störungen erzeugt worden ist. Nach Aussage des Zentralen Grenzwertsatzes der Statistik dürfen die zufälligen Fehler zumindest approximativ als normalverteilt betrachtet werden. Ändern sich die Kenndaten der so postulierten Normalverteilung während des Aufzeichnens der Einzelmessungen nicht, so arbeitet die Messapparatur im Sinne der Terminologie der Statistik stationär (homoskedastisch).

Ursachen: Ursachen der zufälligen Fehler sind

Fluktuationen von Ereignissen, die den Messprozess beeinflussen jedoch nicht kontrollierbar sind, wie beispielsweise in der Physik Thermisches Rauschen, atmosphärische Dichtefluktuationen oder auch Ableserfehler beim "Messen von Hand".

u.v.a.

Standardabweichung oder Stichprobenfehler: Ein Maß für den Fehler, den man durch Stichprobenziehung bei der Mittelwertbestimmung des wahren Werts macht, ist die sogenannte Standardabweichung für den Mittelwert. Dieser geht aus der empirisch bestimmten Messunsicherheit hervor, die man bei jeder einzelnen Messung im Mittel macht. Der Fehler verringert sich bei einer N-maligen Messung um das $\sqrt{N}$ -fache. Der Faktor (N-1) wird hier verwendet, da man sonst bei einer einzelnen Messung und einem Vorfaktor von (N) einen Fehler von 0 erhalten würde, was offensichtlich nicht stimmen kann.

Die Unsicherheitsfaktoren sind Messwerte und besitzen somit ihrerseits einen Messfehler. Deswegen sollte man für typische Messungen den Fehler nur auf ein oder zwei geltende Ziffern angeben. Die Genauigkeit des Messwertes richtet sich nun nach dem bestimmten Fehler.

Inhaltsverzeichnis

1 Störgröße und Residuum

[Bearbeiten] Störgröße und Residuum

Schätzgerade und Modellgerade

Anpassung von beobachteten y-Werten an eine logistische Funktion

Eine Störgröße (auch Störvariable oder latente Variable) aus der Grundgesamtheit entspricht dem Residuum (auch Residualvariable) aus der Stichprobe. Eine Störgröße ist der nichtbeobachtbare Teil einer Varianz. Empirische Beobachtungswerte unterscheiden sich von den theoretischen Werten um den Wert der

Störgröße $u_i = y_i - \tilde y_i$

Da die Störgröße nicht beobachtbar ist, wird sie mit den Residuum geschätzt. Die Residuen sind die Abweichungen der Schätzwerte von den empirischen Beobachtungswerten. Die Residuen berechnen sich demnach als

Residuum $e_i := y_i - \hat y_i$

Die Residuen sind die Abweichungen der empirischen Werte von der Schätzgerade, die Störgrößen sind die Abweichungen von der Modellgerade. Die Schätzgerade soll der Modellgerade möglichst nahe kommen. Die häufig wichtige Varianz der Residuen nennt man Skedastizität.

[Bearbeiten] Störgröße

Exogene (xi) und endogene Variablen (yi) sind beobachtete Werte. Die Störgrößen ui sind nicht beobachtbar. Sie werden als Zufallsvariablen betrachtet. Die Abhängigheit von yi und xi wird von der Störgröße überlagert. Gründe für solche Störungen sind:

weitere fehlende exogene (unabhängige) Variablen
Messfehler
unvorhersagbare Zufälligkeiten

Die Wahrscheinlichkeitsverteilung der Störgröße ui ist unbekannt. Es wird unterstellt, dass sie unabhängig von den Beobachtungswerten xi und Modellparametern ist. Außerdem sei die Störgröße paarweise unabhängig und normalverteilt.

E(ui) = 0 (kein systematischer Einfluss)
V(ui) = sigma^2 = const (Skedastizität)
Cov(ui,ui') = 0 (Autokorrelation)
ui~N(0,sigma^2)

[Bearbeiten] Residuum

Residuen sind die "Restwerte". Unter Residuum versteht man die Differenz zwischen geschätztem Wert (Wert, den das Modell liefert) und empirischen Wert. Das Residuum ist der Anteil der Variabilität (Varianz), der durch ein gegebenes Modell nicht erklärt werden kann. Residuen sind bei der Erstellung von Modellen sorgfältig zu prüfen. Sie geben Hinweise auf die Erfüllung der Voraussetzungen von Modellen. Residuen werden durch Subtrahieren der Modellschätzungen von den eigentlichen Daten berechnet. Ein Residuum ist im Gegensatz zum erklärten Teil der Streuung der nicht-erklärte Teil.

Bei der linearen Regression wird als Residuum e die Abweichnung zwischen der abhängigen Variable y und dem berechneten Wert abhänigen Variable y = a + bx, bezeichnet: ei = yi - yoi Mit Hilfe der Residuen können Aussagen über die Korrektheit des linearen Modells gemacht werden. Ist das Modell korrekt, müssen sich die Werte von ei im gesamten Bereich von yoi ohne erkennbare Struktur (Homoskedastizität) um 0 sammeln. Das Residuum ist die Abweichung des beobachteten y-Wertes vom geschätzten Wert. Residuen sind für jeden Punkt von y die Fehler, die als Differenz zur Ausgleichsgeraden entstehen.

siehe auch http://www.lrz-muenchen.de/~wlm/ilm_r11.htm

Es werden folgende statistische Annahmen getroffen:

a) E(ei|X) = 0

b) Var(ei|X) = sigma^2 (Homoskedastizität)

c) E(eiej|X) = 0 für i ≠ j (keine Autokorrelation)

b) und c) lassen sich zusammenfassen zu

E(ee'|X) = sigma^2*I wobei I:(nxn) die Einheitsmatrix darstellt.

Im Rahmen der Teststatistik und ML-Schätzung wird noch angenommen, das ei bei gegebenem X normalverteilt ist (ei ≈ N(0,sigma^2*I)

[Bearbeiten] Unterschied zwischen Residuum und Statistischem Fehler

Ein Residuum ist eine messbare Schätzung eines nichtmessbaren Fehlers.

Beispiel: Es wird eine Zufallsstichprobe von n Menschen gezogen, dessen Größe gemessen wird. Der Stichprobendurchschnitt (x) wird zur Schätzung des Durchschnitts der Grundgesamtheit (Erwartungswert µ) genutzt, die nicht beobachtbar sei (was häufig der Fall ist). Das bedeutet:

Die Differenz zwischen der Größe eines einzelnen Menschen in der Stichprobe und dem Durchschnitt der nichtbeobachtbaren Grundgesamtheit ist der Statistische Fehler

Die Differenz zwischen der Größe eines einzelnen Menschen in der Stichprobe und dem Durchschnitt der beobachtbaren Stichprobe ist das Residuum.

Residuen sind beobachtbar, Statistische Fehler nicht. Die Summe der Residuen in einer Zufallsstichprobe ist zwingend Null, d. h. Residuen sind zwingend nicht-unabhängig. Die Summe der Statistischen Fehler kann nicht Null sein, die Fehler sind unabhängige Zufallsvariablen, wenn die Individuen unabhängig aus der Grundgesamtheit gezogen wurden. Fehler sind häufig unabhängig voneinander.