Lineare Regression
Mit dem Begriff "lineare Regression" bezeichnet man eine numerische Methode,
die eine möglichst gute Gerade an einen Satz von Meßwerten anpaßt.
Synonym kann auch der Ausdruck "Methode des kleinsten quadratischen Fehlers"
benutzt werden, der das gleiche Verfahren beschreibt.
Theorie und Praxis
Was muß man tun, um eine Gerade möglichst gut an einen Satz von Meßwerten
anzupassen? Natürlich: Man muß versuchen, die Abweichungen zwischen den
Punkten auf der Geraden und den Datenpunkten zu minimieren.
"Man tut so", als wären die Parameter a und b der Gerade
y=a*x+b schon bestimmt und rechnet damit die Summe der Abweichungen
(im Quadrat) aus:
(y1-y(x1))2 +
(y2-y(x2))2 + ...
=
(y1-a*x1-b)2 +
(y2-a*x2-b)2 + ...
Dieser Ausdruck soll in Abhänigkeit von a und b minimal werden: Das heißt man
leitet partiell nach beiden Parametern ab und setzt die Ableitungen gleich
Null. Daraus erhält man geschlossene Ausdrücke, die sowohl die Steigung als
auch den Achsenabschnitt bestimmen.
Wie das genauer funktioniert und welche Formalismen dahinterstecken steht
auf dieser Seite der Uni Basel oder in Walcher, "Praktikum der Physik".
An der Uni Basel gibt es auch eine schöne Seite, auf der man
lineare Regressionen ausführen kann.
Zum Schluß noch eine Anmerkung: Der sog. "R-Faktor" ist ein Maß für die Güte
der linearen Regression. Er liegt zwischen 0 und 1. Je näher er der 1 kommt,
desto wahrscheinlicher ist es, daß die Meßpunkte wirklich einem linearen
Gesetz gehorchen. Ein Maß für den Fehler von a oder b ist diese Größe jedoch
nicht!
Wie funktioniert das in MS Excel?
Die einfachste Möglichkeit ist das Einfügen einer sog. Trendlinie ins
Diagramm.
Dazu geht man vor wie folgt:
- Im Diagramm mit der rechten Maustaste auf einen Punkt der
Datenreihe klicken,
- In dem Menü, das sich dann auftut, den Punkt "Trendlinie hinzufügen..."
auswählen,
- Darauf erscheint ein Fenster namens "Trendlinie".
Auf der Registerkarte "Typ" muß man "Linear" auswählen, auf der
Registerkarte "Optionen" muß das Kästchen "Formel im Diagramm
darstellen" angekreuzt werden.
- Dann "OK" anklicken - FERTIG!
In diesem Fall müssen die Fehler von Steigung (und Achsenabschnitt) noch
graphisch bestimmt werden.
ACHTUNG: "R2" ist nicht der Fehler der berechneten Werte, sondern
gibt die Güte der Regression an!!!
Excel kann aber auch die Fehler von Steigung und Achsenabschnitt berechnen.
Dazu gibt es eine Funktion namens "RGP". Die wird in der Tabelle (nicht im
Diagramm) verwendet und funktioniert wie folgt:
- An einer freien Stelle im Diagramm einen Block aus 5 Zeilen und 2
Spalten definieren
- folgenden Text eingeben:
=RGP(y_Werte;x_Werte;WAHR;WAHR)
dabei müssen selbstverständlich für die Platzhalter y_Werte
und x_Werte die entsprechenden Bereiche in der Tabelle
verwendet werden (also z.B. etwas wie A1:A5).
- WICHTIG: Die Eingabe mit [CTRL]+[SHIFT]+[ENTER]
(= [STRG]+[UMSCHALT]+[EINGABE]) beenden, keinesfalls mit einem
Klick auf den grünen Haken oder nur durch Drücken der Eingabetaste!
Das sorgt dafür, daß die Formel als Matrixformel behandelt wird.
- Die in dem markierten Bereich jetzt angezeigten Zahlen geben sämtliche
Ergebnisse der Regressionsanalyse wieder: FERTIG!
Die Reihenfolge der wichtigsten Ergebnisse ist diese:
| Steigung |
y-Achsenabschnitt |
| Fehler der Steigung |
Fehler des y-Achsenabschnitts |
| ... |
... |
Eine genauere Beschreibung der ausgegebenen Werte, sowie weitere Hinweise zu
der "RGP"-Funktion würden den Rahmen dieser Seite sprengen, sie sind aber in
der Hilfe zu Excel finden.
Viel Erfolg!