Pearson-Korrelationskoeffizient

Definition des Pearson-Korrelationskoeffizienten

Der Pearson-Korrelationskoeffizient, auch als statistischer Pearson R-Test bekannt, misst die Stärke zwischen den verschiedenen Variablen und ihren Beziehungen. Wenn ein statistischer Test zwischen den beiden Variablen durchgeführt wird, ist es für die Person, die die Analyse durchführt, immer eine gute Idee, den Wert des Korrelationskoeffizienten zu berechnen, um zu wissen, wie stark die Beziehung zwischen den beiden Variablen ist.

Der Pearson-Korrelationskoeffizient gibt einen Wert zwischen -1 und 1 zurück. Die Interpretation des Korrelationskoeffizienten lautet wie folgt:

  • Wenn der Korrelationskoeffizient -1 ist, zeigt dies eine starke negative Beziehung an. Dies impliziert eine perfekte negative Beziehung zwischen den Variablen.
  • Wenn der Korrelationskoeffizient 0 ist, zeigt dies keine Beziehung an.
  • Wenn der Korrelationskoeffizient 1 ist, zeigt dies eine starke positive Beziehung an. Dies impliziert eine perfekte positive Beziehung zwischen den Variablen.

Ein höherer absoluter Wert des Korrelationskoeffizienten zeigt eine stärkere Beziehung zwischen Variablen an. Somit zeigt ein Korrelationskoeffizient von 0,78 eine stärkere positive Korrelation im Vergleich zu einem Wert von beispielsweise 0,36 an. In ähnlicher Weise zeigt ein Korrelationskoeffizient von -0,87 eine stärkere negative Korrelation im Vergleich zu einem Korrelationskoeffizienten von beispielsweise -0,40 an.

Mit anderen Worten, wenn der Wert im positiven Bereich liegt, zeigt dies, dass die Beziehung zwischen Variablen positiv korreliert ist und beide Werte zusammen abnehmen oder zunehmen. Wenn andererseits der Wert im negativen Bereich liegt, zeigt dies, dass die Beziehung zwischen Variablen negativ korreliert ist und beide Werte in die entgegengesetzte Richtung gehen.

Pearson-Korrelationskoeffizientenformel

Die Pearson-Korrelationskoeffizientenformel lautet wie folgt:

Wo,

  • r = Pearson-Koeffizient
  • n = Anzahl der Aktienpaare
  • ∑xy = Summe der Produkte der gepaarten Bestände
  • ∑x = Summe der x-Punkte
  • ∑y = Summe der y-Werte
  • ∑x2 = Summe der quadratischen x-Werte
  • ∑y2 = Summe der quadratischen y-Werte

Erläuterung

Schritt 1: Ermitteln Sie die Anzahl der Variablenpaare, die mit n bezeichnet wird. Nehmen wir an, x besteht aus 3 Variablen - 6, 8, 10. Nehmen wir an, dass y aus den entsprechenden 3 Variablen 12, 10, 20 besteht.

Schritt 2: Listen Sie die Variablen in zwei Spalten auf.

Schritt 3: Finden Sie das Produkt von x und y in der 3. Spalte heraus.

Schritt 4: Ermitteln Sie die Summe der Werte aller x-Variablen und aller y-Variablen. Schreiben Sie die Ergebnisse unten in die 1. und 2. Spalte. Schreiben Sie die Summe von x * y in die 3. Spalte.

Schritt 5: Finden Sie x2 und y2 in der 4. und 5. Spalte und ihre Summe am unteren Rand der Spalten heraus.

Schritt 6: Fügen Sie die oben angegebenen Werte in die Formel ein und lösen Sie sie.

r = 3 · 352-24 · 42 / √ (3 · 200-242) · (3 · 644-422)

= 0,7559

Beispiel für den Pearson-Korrelationskoeffizienten R.

Sie können diese Pearson-Korrelationskoeffizienten-Excel-Vorlage hier herunterladen - Pearson-Korrelationskoeffizienten-Excel-Vorlage

Beispiel 1

In diesem Beispiel mit Hilfe der folgenden Details in der Tabelle der 6 Personen mit einem unterschiedlichen Alter und unterschiedlichen Gewichten, die unten für die Berechnung des Wertes des Pearson R angegeben sind

Lösung:

Für die Berechnung des Pearson-Korrelationskoeffizienten berechnen wir zunächst die folgenden Werte:

Hier beträgt die Gesamtzahl der Personen 6, also n = 6

Nun ist die Berechnung des Pearson R wie folgt:

  • r = (n (∑xy) - (∑x) (∑y)) / (√ [n ∑x2- (∑x) 2] [n ∑y2– (∑y) 2)
  • r = (6 * (13937) - (202) (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (6 * (13937) - (202) * (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (83622-82618) / (√ [43680-40804] * [170190-167281)
  • r = 1004 / (√ [2876] * [2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892,452938
  • r = 0,35

Somit beträgt der Wert des Pearson-Korrelationskoeffizienten 0,35

Beispiel 2

Es gibt 2 Aktien - A und B. Ihre Aktienkurse an bestimmten Tagen sind wie folgt:

Ermitteln Sie den Pearson-Korrelationskoeffizienten aus den obigen Daten.

Lösung:

Zunächst berechnen wir die folgenden Werte.

Die Berechnung des Pearson-Koeffizienten ist wie folgt:

  • r =  (5 * 1935-266 * 37) / ((5 * 14298- (266) ^ 2) * (5 * 283- (37) ^ 2)) ^ 0,5
  • = -0,9088

Daher beträgt der Pearson-Korrelationskoeffizient zwischen den beiden Aktien -0,9088.

Vorteile

  • Es hilft zu wissen, wie stark die Beziehung zwischen den beiden Variablen ist. Mit dem Pearson-Korrelationskoeffizienten wird nicht nur das Vorhandensein oder Nichtvorhandensein der Korrelation zwischen den beiden Variablen angezeigt, sondern es wird auch das genaue Ausmaß bestimmt, in dem diese Variablen korreliert sind.
  • Mit dieser Methode kann man die Richtung der Korrelation bestimmen, dh ob die Korrelation zwischen zwei Variablen negativ oder positiv ist.

Nachteile

  • Der Pearson-Korrelationskoeffizient R reicht nicht aus, um den Unterschied zwischen den abhängigen Variablen und den unabhängigen Variablen festzustellen, da der Korrelationskoeffizient zwischen den Variablen symmetrisch ist. Wenn eine Person beispielsweise versucht, die Korrelation zwischen hohem Stress und Blutdruck zu kennen, kann man den hohen Wert der Korrelation finden, der zeigt, dass hoher Stress den Blutdruck verursacht. Wenn nun die Variable umgeschaltet wird, ist das Ergebnis in diesem Fall auch dasselbe, was zeigt, dass Stress durch den Blutdruck verursacht wird, der keinen Sinn ergibt. Daher sollte der Forscher die Daten kennen, die er für die Durchführung der Analyse verwendet.
  • Mit dieser Methode kann man keine Informationen über die Steigung der Linie erhalten, da nur angegeben wird, ob eine Beziehung zwischen den beiden Variablen besteht oder nicht.
  • Es ist wahrscheinlich, dass der Pearson-Korrelationskoeffizient insbesondere bei homogenen Daten falsch interpretiert wird.
  • Im Vergleich zu den anderen Berechnungsmethoden benötigt diese Methode viel Zeit, um zu den Ergebnissen zu gelangen.

Wichtige Punkte

  • Die Werte können vom Wert +1 bis zum Wert -1 reichen, wobei +1 die perfekte positive Beziehung zwischen den betrachteten Variablen angibt, -1 die perfekte negative Beziehung zwischen den betrachteten Variablen angibt und ein 0-Wert angibt, dass keine Beziehung besteht existiert zwischen den betrachteten Variablen.
  • Sie ist unabhängig von der Maßeinheit der Variablen. Wenn beispielsweise die Maßeinheit einer Variablen in Jahren angegeben ist, während die Maßeinheit der zweiten Variablen in Kilogramm angegeben ist, ändert sich der Wert dieses Koeffizienten auch dann nicht.
  • Der Korrelationskoeffizient zwischen den Variablen ist symmetrisch, was bedeutet, dass der Wert des Korrelationskoeffizienten zwischen Y und X oder X und Y gleich bleibt.

Fazit

Der Pearson-Korrelationskoeffizient ist der Typ des Korrelationskoeffizienten, der die Beziehung zwischen den beiden Variablen darstellt, die auf demselben Intervall oder derselben Verhältnisskala gemessen werden. Es misst die Stärke der Beziehung zwischen den beiden kontinuierlichen Variablen.

Es gibt nicht nur das Vorhandensein oder Fehlen der Korrelation zwischen den beiden Variablen an, sondern bestimmt auch das genaue Ausmaß, in dem diese Variablen korreliert sind. Sie ist unabhängig von der Maßeinheit der Variablen, bei der die Werte des Korrelationskoeffizienten vom Wert +1 bis zum Wert -1 reichen können. Es reicht jedoch nicht aus, den Unterschied zwischen den abhängigen Variablen und den unabhängigen Variablen zu erkennen.