Ausreißerformel

Die Ausreißerformel bietet ein grafisches Werkzeug zum Berechnen der Daten, die sich außerhalb des angegebenen Verteilungssatzes befinden und je nach Variablen Innen- oder Außenseite sein können.

Was ist die Ausreißerformel?

Ein Ausreißer ist der Datenpunkt der gegebenen Probe oder Beobachtung oder in einer Verteilung, die außerhalb des Gesamtmusters liegen soll. Eine häufig verwendete Regel, die besagt, dass ein Datenpunkt als Ausreißer betrachtet wird, wenn er mehr als 1,5 IQR unter dem ersten Quartil oder über dem dritten Quartil aufweist.

Anders gesagt, niedrige Ausreißer müssen unter Q1-1.5 IQR liegen und hohe Ausreißer müssen unter Q3 + 1.5IQR liegen

Man muss Median, Quartile einschließlich IQR, Q1 und Q3 berechnen.

Die Ausreißerformel wird wie folgt dargestellt:

Die Formel für Q1 = ¼ (n + 1) Term Die Formel für Q3 = ¾ (n + 1) Term Die Formel für Q2 = Q3 - Q1

Schritt für Schritt Berechnung des Ausreißers

Die folgenden Schritte müssen befolgt werden, um den Ausreißer zu berechnen.

  • Schritt 1: Berechnen Sie zuerst die Quartile, dh Q1, Q2 und Interquartil
  • Schritt 2: Berechnen Sie nun den Wert Q2 * 1.5
  • Schritt 3: Subtrahieren Sie nun den Q1-Wert von dem in Schritt 2 berechneten Wert
  • Schritt 4: Fügen Sie hier Q3 mit dem in Schritt 2 berechneten Wert hinzu
  • Schritt 5: Erstellen Sie den Bereich der in Schritt 3 und Schritt 4 berechneten Werte
  • Schritt 6: Ordnen Sie die Daten in aufsteigender Reihenfolge an
  • Schritt 7: Überprüfen Sie, ob Werte vorhanden sind, die unter oder über dem in Schritt 5 erstellten Bereich liegen

Beispiel

Betrachten Sie einen Datensatz mit folgenden Zahlen: 10, 2, 4, 7, 8, 5, 11, 3, 12. Sie müssen alle Ausreißer berechnen.

Lösung:

Zuerst müssen wir die Daten in aufsteigender Reihenfolge anordnen, um den Median zu finden, der für uns Q2 sein wird.

2, 3, 4, 5, 7, 8, 10, 11, 12

Da nun die Anzahl der Beobachtungen ungerade ist (9), würde der Median auf einer 5. Position liegen, die 7 ist, und für dieses Beispiel ist Q2 gleich.

Daher ist die Berechnung von Q1 wie folgt:

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 wird sein - 

Q1 = 2,5 Term

Dies bedeutet, dass Q1 der Durchschnitt der 2. und 3. Position der Beobachtungen ist, der hier 3 & 4 ist, und ein Durchschnitt derselben ist (3 + 4) / 2 = 3,5

Daher ist die Berechnung von Q3 wie folgt:

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 wird sein - 

Q3 = 7,5 Laufzeit

Dies bedeutet, dass Q3 der Durchschnitt der 7. und 8. Position der Beobachtungen ist, der hier 10 & 11 ist, und ein Durchschnitt derselben ist (10 + 11) / 2 = 10,5

Niedrige Ausreißer sollen nun unter Q1-1.5IQR und hohe Ausreißer unter Q3 + 1.5IQR liegen

Die Werte sind also 3,5 - (1,5 * 7) = -7 und der höhere Bereich ist 10,5 + (1,5 * 7) = 110,25.

Da es keine Beobachtungen gibt, die über oder unter 110,25 und -7 liegen, haben wir in dieser Stichprobe keine Ausreißer.

Beispiel einer Ausreißerformel in Excel (mit Excel-Vorlage)

Sie können diese Ausreißer-Formel-Excel-Vorlage hier herunterladen - Ausreißer-Formel-Excel-Vorlage

In kreativen Coaching-Kursen wird erwogen, Schüler zu belohnen, die unter den besten 25% liegen. Sie möchten jedoch Ausreißer vermeiden. Die Daten beziehen sich auf die 25 Schüler. Verwenden Sie die Ausreißergleichung, um festzustellen, ob es einen Ausreißer gibt.

Lösung:

Nachfolgend finden Sie Daten zur Berechnung des Ausreißers

Die Anzahl der Beobachtungen beträgt hier 25 und unser erster Schritt wäre die Konvertierung der Rohdaten in aufsteigender Reihenfolge.

Median wird sein -

Der Medianwert = ½ (n + 1)

= ½ = ½ (26)

= 13. Amtszeit

Der Q2 oder Median beträgt 68,00

Welches ist 50% der Bevölkerung.

Q1 wird sein -

Q1 = ¼ (n + 1) -ter Term

= ¼ (25 + 1)

= ¼ (26)

= 6,5. Term, was dem 7. Term entspricht

Der Q1 ist 56,00, was unter 25% liegt

Q3 wird sein -

Schließlich ist Q3 = ¾ (n + 1). Term

= ¾ (26)

= 19,50 Laufzeit

Hier muss der Durchschnitt aus dem 19. und 20. Term genommen werden, der 77 und 77 ist, und der Durchschnitt aus (77 + 77) / 2 = 77,00

 Der Q3 ist 77, was Top 25% ist

Niedrige Reichweite

Niedrige Ausreißer sollen nun unter Q1-1.5IQR und hohe Ausreißer unter Q3 + 1.5IQR liegen

Hohe Reichweite -

Die Werte sind also 56 - (1,5 * 68) = -46 und der höhere Bereich ist 77 + (1,5 * 68) = 179.

Es gibt keine Ausreißer.

Relevanz und Verwendung

Die Ausreißerformel ist sehr wichtig zu wissen, da es Daten geben kann, die durch einen solchen Wert verzerrt werden. Nehmen Sie ein Beispiel für die Beobachtungen 2, 4, 6, 101, und wenn jemand einen Durchschnitt dieser Werte nimmt, sind es 28,25, aber 75% der Beobachtungen liegen unter 7, und daher wäre eine falsche Entscheidung bezüglich der Beobachtungen dieser Stichprobe.

Es ist hier zu bemerken, dass 101 klar zu umreißen scheint, und wenn dies entfernt wird, wäre der Durchschnitt 4, was über die Werte oder Beobachtungen aussagt, dass sie im Bereich von 4 liegen. Daher ist es sehr wichtig, diese Berechnung durchzuführen, um dies zu vermeiden jeglicher Missbrauch führender Informationen der Daten. Diese werden von Statistikern auf der ganzen Welt häufig verwendet, wenn sie Nachforschungen anstellen.