Regression der kleinsten Quadrate

Definition der Regressionsmethode für kleinste Quadrate

Eine Regressionsmethode der kleinsten Quadrate ist eine Form der Regressionsanalyse, die die Beziehung zwischen der abhängigen und der unabhängigen Variablen zusammen mit einer linearen Linie festlegt. Diese Linie wird als "Linie der besten Anpassung" bezeichnet.

Die Regressionsanalyse ist eine statistische Methode, mit deren Hilfe die unbekannten Werte einer Variablen aus den bekannten Werten einer anderen Variablen geschätzt oder vorhergesagt werden können. Die Variable, die zur Vorhersage des Variableninteresses verwendet wird, wird als unabhängige oder erklärende Variable bezeichnet, und die vorhergesagte Variable wird als abhängige oder erklärte Variable bezeichnet.

Betrachten wir zwei Variablen x & y. Diese sind in einem Diagramm mit Werten von x auf der x-Achse und Werten von y auf der y-Achse aufgetragen. Diese Werte werden durch die Punkte in der folgenden Grafik dargestellt. Durch die Punkte wird eine gerade Linie gezogen, die als die Linie der besten Anpassung bezeichnet wird.

Das Ziel der Regression der kleinsten Quadrate besteht darin, sicherzustellen, dass die durch die Menge der bereitgestellten Werte gezogene Linie die engste Beziehung zwischen den Werten herstellt.

Regressionsformel für kleinste Quadrate

Die Regressionslinie nach der Methode der kleinsten Quadrate wird nach der folgenden Formel berechnet:

ŷ = a + bx

Wo,

  • ŷ = abhängige Variable
  • x = unabhängige Variable
  • a = y-Achsenabschnitt
  • b = Steigung der Linie

Die Steigung der Linie b wird nach folgender Formel berechnet:

Oder

Der Y-Achsenabschnitt 'a' wird unter Verwendung der folgenden Formel berechnet:

Linie der besten Anpassung in der Regression des kleinsten Quadrats

Die Linie der besten Anpassung ist eine gerade Linie, die durch eine Streuung von Datenpunkten gezogen wird und die Beziehung zwischen ihnen am besten darstellt.

Betrachten wir das folgende Diagramm, in dem ein Datensatz entlang der x- und y-Achse aufgetragen ist. Diese Datenpunkte werden mit den blauen Punkten dargestellt. Durch diese Punkte werden drei Linien gezogen - eine grüne, eine rote und eine blaue Linie. Die grüne Linie verläuft durch einen einzelnen Punkt und die rote Linie durch drei Datenpunkte. Die blaue Linie verläuft jedoch durch vier Datenpunkte, und der Abstand zwischen den Restpunkten und der blauen Linie ist im Vergleich zu den beiden anderen Linien minimal.

In der obigen Grafik stellt die blaue Linie die Linie der besten Anpassung dar, da sie allen Werten am nächsten liegt und der Abstand zwischen den Punkten außerhalb der Linie zur Linie minimal ist (dh der Abstand zwischen den Residuen zur Linie der besten Anpassung - auch als Quadratsummen der Residuen bezeichnet). In den beiden anderen Linien, der orangefarbenen und der grünen, ist der Abstand zwischen den Residuen zu den Linien im Vergleich zur blauen Linie größer.

Die Methode der kleinsten Quadrate liefert die engste Beziehung zwischen den abhängigen und unabhängigen Variablen, indem der Abstand zwischen den Residuen und der Linie der besten Anpassung minimiert wird, dh die Summe der Quadrate der Residuen ist bei diesem Ansatz minimal. Daher der Begriff "kleinste Quadrate".

Beispiele für die Regressionsgerade der kleinsten Quadrate

Wenden wir diese Formeln in der folgenden Frage an -

Sie können diese Excel-Vorlage für die Regression der kleinsten Quadrate hier herunterladen - Excel-Vorlage für die Regression der kleinsten Quadrate

Beispiel 1

Die Einzelheiten zur Erfahrung von Technikern in einem Unternehmen (in einigen Jahren) und ihrer Leistungsbewertung sind in der folgenden Tabelle aufgeführt. Schätzen Sie anhand dieser Werte die Leistungsbewertung für einen Techniker mit 20 Jahren Erfahrung.

Lösung -

Um zuerst die kleinsten Quadrate zu berechnen, berechnen wir den Y-Achsenabschnitt (a) und die Steigung einer Linie (b) wie folgt:

Die Steigung der Linie (b)

  • b = 6727 - [(80 * 648) / 8] / 1018 - [(80) 2/8]
  • = 247/218
  • = 1,13

Y-Achsenabschnitt (a)

  • a = 648 - (1,13) (80) / 8
  • = 69,7

Die Regressionsgerade wird wie folgt berechnet:

Ersetzen Sie den Wert von x in der Formel durch 20.

  • ŷ = a + bx
  • ŷ = 69,7 + (1,13) (20)
  • ŷ = 92,3

Die Leistungsbewertung für einen Techniker mit 20 Jahren Erfahrung wird auf 92,3 geschätzt.

Beispiel 2

Regressionsgleichung der kleinsten Quadrate mit Excel

Die Regressionsgleichung der kleinsten Quadrate kann mit Excel durch die folgenden Schritte berechnet werden:

  • Datentabelle in Excel einfügen.

  • Fügen Sie mithilfe der Datenpunkte ein Streudiagramm ein.

  • Fügen Sie eine Trendlinie in das Streudiagramm ein.

  • Wählen Sie unter Trendlinienoptionen die Option Lineare Trendlinie und dann die Anzeigegleichung im Diagramm aus.

  • Die Regressionsgleichung der kleinsten Quadrate für den angegebenen Satz von Excel-Daten wird im Diagramm angezeigt.

Somit wird die Regressionsgleichung der kleinsten Quadrate für den gegebenen Satz von Excel-Daten berechnet. Unter Verwendung der Gleichung können Vorhersagen und Trendanalysen gemacht werden. Excel-Tools bieten auch detaillierte Regressionsberechnungen.

Vorteile

  • Die Methode der kleinsten Quadrate der Regressionsanalyse eignet sich am besten für Vorhersagemodelle und Trendanalysen. Es wird am besten in den Bereichen Wirtschaft, Finanzen und Aktienmärkte verwendet, in denen der Wert einer zukünftigen Variablen mithilfe vorhandener Variablen und der Beziehung zwischen diesen vorhergesagt wird.
  • Die Methode der kleinsten Quadrate liefert die engste Beziehung zwischen den Variablen. Der Unterschied zwischen den Quadratsummen der Residuen und der Linie der besten Anpassung ist bei dieser Methode minimal.
  • Der Berechnungsmechanismus ist einfach und leicht anzuwenden.

Nachteile

  • Die Methode der kleinsten Quadrate beruht auf der Ermittlung der engsten Beziehung zwischen einem bestimmten Satz von Variablen. Der Berechnungsmechanismus reagiert empfindlich auf die Daten und kann im Falle von Ausreißern (außergewöhnlichen Daten) die Ergebnisse erheblich beeinflussen.
  • Diese Art der Berechnung eignet sich am besten für lineare Modelle. Für nichtlineare Gleichungen werden umfassendere Berechnungsmechanismen angewendet.

Fazit

Die Methode der kleinsten Quadrate ist eine der am häufigsten verwendeten Methoden für Vorhersagemodelle und Trendanalysen. Bei entsprechender Berechnung liefert es die besten Ergebnisse.