Was ist eine Lineare Regression? – Erklärung & Beispiel

Der Zusammenhang zwischen einer abhängigen und einer unabhängigen Variablen wird durch die lineare Regression untersucht.

Gebildet wird dieser Zusammenhang mit einer linearen Funktion yi = α + β × xi
α ist dabei der Achsenabschnitt und β die Steigung der Geraden.

Zuerst sollte ein Streudiagramm angelegt werden, damit man prüfen kann, ob die lineare Regression für die beiden Variablen anwendbar ist. Das ist dann der Fall, wenn die Messwerte nahezu auf einer Geraden liegen.

Alternative Bezeichnungen

Die lineare Regression kann auch Ausgleichsgerade, einfache lineare Regression, sowie lineare Regressionsanalyse oder lineares Regressionsmodell genannt werden.

Ein Beispiel

Ob es bei der Schuhgröße und der Körpergröße von Anton, Bernd und Claus einen linearen Zusammenhang gibt, wird so festgestellt, indem die Schuhgröße, welche die Variable y ist, aus der Körpergröße, welche dann die Variable x ist, abgeleitet bzw. prognostiziert wird.

Im ersten Schritt müssen die arithmetischen Mittelwerte für die Körpergröße und die Schuhgröße berechnet werden.
Das bedeutet für die Körpergröße: (170 cm + 180 cm + 190 cm) / 3 = 180 cm.

Und für die Schuhgrösse: (41 + 42 + 43) / 3 = 126 / 3 = 42.
In einem zweiten Schritt werden die jeweiligen Abweichungen von dem Mittelwert für die Körpergröße berechnet und diese anschließend quadriert. Das selbe wird mit den Abweichungen der Schuhgröße gemacht und die beiden Ergebnisse werden in einem dritten Schritt miteinander multipliziert.
Danach wird die Steigung berechnet, was dadurch gemacht wird, dass die Summe der multiplizierten Abweichungen durch die Summe der quadrierten Abweichungen der Körpergröße geteilt werden: 20 / 200 = 0,1.
Als Formel heißt das: β = ∑ [(xi – ∅x) × (yi – ∅y)] / ∑(xi – ∅x)2

Diese ermittelte Steigung ist dem Quotienten aus der Kovarianz (20/3) und der Varianz der Körpergröße (200/3) gleich.
Der letzten Schritt besteht darin, dass der Achsenabschnitt berechnet wird.
Das wird dadurch gemacht, dass der Durchschnitt von der Körpergröße von dem Durchschnitt der Schuhgröße abgezogen wird: 42 – 0,10 × 180 = 24, was als Formel geschrieben α = ∅y – β × ∅x ist.

Regressionsgerade

Um die Regressionsgerade als lineare Funktion anfertigen zu können, muss die Formel 24 + 0,1 × Körpergröße angewandt werden, was als allgemeine Formel so geschrieben wird: yi = α + β × xi

α (24) ist dabei der Schnittpunkt mit der y-Achse, β (0,1) die Steigung der Regressionsgeraden und xi bzw. yi die jeweiligen Körper- und Schuhgröße.
α und β können auch als Regressionskoeffizienten bezeichnet werden, bei welchen ß angibt, um wie viele Einheiten Y steigt.

Das bedeutet für Anton: 24 + 0,1 × 170 = 41.
Für Bernd: 24 + 0,1 × 180 = 42.
Und für Claus: 24 + 0,1 × 190 = 43.

Hinweis

Genutzt werden kann die Regressionsformel, damit eine Prognose für Schuhgrößen für bestimme Körpergrößen vorgenommen werden kann.

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here

* Die Checkbox für die Zustimmung zur Speicherung ist nach DSGVO zwingend.

Ich stimme zu.