Lineare Regression

Mit dem Begriff "lineare Regression" bezeichnet man eine numerische Methode, die eine möglichst gute Gerade an einen Satz von Meßwerten anpaßt.
Synonym kann auch der Ausdruck "Methode des kleinsten quadratischen Fehlers" benutzt werden, der das gleiche Verfahren beschreibt.

Theorie und Praxis

Was muß man tun, um eine Gerade möglichst gut an einen Satz von Meßwerten anzupassen? Natürlich: Man muß versuchen, die Abweichungen zwischen den Punkten auf der Geraden und den Datenpunkten zu minimieren.

plot zur LR
"Man tut so", als wären die Parameter a und b der Gerade y=a*x+b schon bestimmt und rechnet damit die Summe der Abweichungen (im Quadrat) aus:
(y1-y(x1))2 + (y2-y(x2))2 + ...
= (y1-a*x1-b)2 + (y2-a*x2-b)2 + ...
Dieser Ausdruck soll in Abhänigkeit von a und b minimal werden: Das heißt man leitet partiell nach beiden Parametern ab und setzt die Ableitungen gleich Null. Daraus erhält man geschlossene Ausdrücke, die sowohl die Steigung als auch den Achsenabschnitt bestimmen.
Wie das genauer funktioniert und welche Formalismen dahinterstecken steht auf dieser Seite der Uni Basel oder in Walcher, "Praktikum der Physik".
An der Uni Basel gibt es auch eine schöne Seite, auf der man lineare Regressionen ausführen kann.
Zum Schluß noch eine Anmerkung: Der sog. "R-Faktor" ist ein Maß für die Güte der linearen Regression. Er liegt zwischen 0 und 1. Je näher er der 1 kommt, desto wahrscheinlicher ist es, daß die Meßpunkte wirklich einem linearen Gesetz gehorchen. Ein Maß für den Fehler von a oder b ist diese Größe jedoch nicht!

Wie funktioniert das in MS Excel?

Die einfachste Möglichkeit ist das Einfügen einer sog. Trendlinie ins Diagramm.
Dazu geht man vor wie folgt:

  1. Im Diagramm mit der rechten Maustaste auf einen Punkt der Datenreihe klicken,
  2. In dem Menü, das sich dann auftut, den Punkt "Trendlinie hinzufügen..." auswählen,
  3. Darauf erscheint ein Fenster namens "Trendlinie".
    Auf der Registerkarte "Typ" muß man "Linear" auswählen, auf der Registerkarte "Optionen" muß das Kästchen "Formel im Diagramm darstellen" angekreuzt werden.
  4. Dann "OK" anklicken - FERTIG!
In diesem Fall müssen die Fehler von Steigung (und Achsenabschnitt) noch graphisch bestimmt werden.
ACHTUNG: "R2" ist nicht der Fehler der berechneten Werte, sondern gibt die Güte der Regression an!!!

Excel kann aber auch die Fehler von Steigung und Achsenabschnitt berechnen. Dazu gibt es eine Funktion namens "RGP". Die wird in der Tabelle (nicht im Diagramm) verwendet und funktioniert wie folgt:
  1. An einer freien Stelle im Diagramm einen Block aus 5 Zeilen und 2 Spalten definieren
  2. folgenden Text eingeben:
        =RGP(y_Werte;x_Werte;WAHR;WAHR)
    dabei müssen selbstverständlich für die Platzhalter y_Werte und x_Werte die entsprechenden Bereiche in der Tabelle verwendet werden (also z.B. etwas wie A1:A5).
  3. WICHTIG: Die Eingabe mit [CTRL]+[SHIFT]+[ENTER] (= [STRG]+[UMSCHALT]+[EINGABE]) beenden, keinesfalls mit einem Klick auf den grünen Haken oder nur durch Drücken der Eingabetaste!
    Das sorgt dafür, daß die Formel als Matrixformel behandelt wird.
  4. Die in dem markierten Bereich jetzt angezeigten Zahlen geben sämtliche Ergebnisse der Regressionsanalyse wieder: FERTIG!
Die Reihenfolge der wichtigsten Ergebnisse ist diese:
Steigung y-Achsenabschnitt
Fehler der Steigung Fehler des y-Achsenabschnitts
... ...
Eine genauere Beschreibung der ausgegebenen Werte, sowie weitere Hinweise zu der "RGP"-Funktion würden den Rahmen dieser Seite sprengen, sie sind aber in der Hilfe zu Excel finden.

Viel Erfolg!