Chi-Quadrat-Test in Excel

Chi-Quadrat-Test mit Excel

Der Chi-Quadrat-Test in Excel ist der am häufigsten verwendete nichtparametrische Test zum Vergleichen von zwei oder mehr Variablen für zufällig ausgewählte Daten. Es ist eine Art von Test, der verwendet wird, um die Beziehung zwischen zwei oder mehr Variablen herauszufinden. Dies wird in Statistiken verwendet, die auch als Chi-Quadrat-P-Wert bezeichnet werden. In Excel haben wir keine eingebaute Funktion, können sie aber verwenden Formeln zur Durchführung eines Chi-Quadrat-Tests in Excel unter Verwendung der mathematischen Formel für den Chi-Quadrat-Test.

Typen

  1. Chi-Quadrat-Test auf Passgenauigkeit
  2. Chi-Quadrat-Test für die Unabhängigkeit zweier Variablen.

# 1 - Chi-Quadrat-Test für gute Passform

Es wird verwendet, um die Nähe einer Stichprobe wahrzunehmen, die zu einer Population passt. Das Symbol des Chi-Quadrat-Tests ist (2). Dies ist die Summe aller ( Beobachtete Anzahl - Erwartete Anzahl) 2 / Erwartete Anzahl.

  • wo k-1 Freiheitsgrade oder DF.
  • Wobei Oi die beobachtete Frequenz ist, k Kategorien sind und Ei die erwartete Frequenz ist.

Hinweis: - Die Anpassungsgüte eines statistischen Modells bezieht sich auf das Verständnis, wie gut Probendaten zu einer Reihe von Beobachtungen passen.

Verwendet

  • Die Kreditwürdigkeit von Kreditnehmern basierend auf ihren Altersgruppen und persönlichen Darlehen
  • Das Verhältnis zwischen der Leistung der Verkäufer und der erhaltenen Ausbildung
  • Rendite auf eine einzelne Aktie und auf Aktien eines Sektors wie Pharma oder Bankwesen
  • Kategorie der Zuschauer und die Auswirkungen einer TV-Kampagne.

# 2 - Chi-Quadrat-Test für die Unabhängigkeit von zwei Variablen

Es wird verwendet, um zu überprüfen, ob die Variablen voneinander unabhängig sind oder nicht. Mit (r-1) (c-1) Freiheitsgraden

Dabei ist Oi die beobachtete Häufigkeit, r die Anzahl der Zeilen, c die Anzahl der Spalten und Ei die erwartete Häufigkeit

Hinweis: - Zwei Zufallsvariablen werden als unabhängig bezeichnet, wenn die Wahrscheinlichkeitsverteilung einer Variablen nicht von der anderen beeinflusst wird.

Verwendet

Der Unabhängigkeitstest eignet sich für folgende Situationen:

  • Es gibt eine kategoriale Variable.
  • Es gibt zwei kategoriale Variablen, und Sie müssen die Beziehung zwischen ihnen bestimmen.
  • Es gibt Kreuztabellen, und die Beziehung zwischen zwei kategorialen Variablen muss gefunden werden.
  • Es gibt nicht quantifizierbare Variablen (Antworten auf Fragen wie: Wählen Mitarbeiter in verschiedenen Altersgruppen unterschiedliche Arten von Gesundheitsplänen aus?)

Wie mache ich den Chi-Quadrat-Test in Excel? (mit Beispiel)

Sie können diese Chi Square Test Excel-Vorlage hier herunterladen - Chi Square Test Excel-Vorlage

Der Manager eines Restaurants möchte den Zusammenhang zwischen Kundenzufriedenheit und den Gehältern der auf Tische wartenden Personen ermitteln. In diesem Artikel werden wir die Hypothese aufstellen, um das Chi-Quadrat zu testen

  • Sie nimmt eine Zufallsstichprobe von 100 Kunden und fragt, ob der Service ausgezeichnet, gut oder schlecht sei.
  • Sie kategorisiert dann die Gehälter der wartenden Personen als niedrig, mittel und hoch.
  • Angenommen, das Signifikanzniveau beträgt 0,05. Hier bezeichnen H0 und H1 die Unabhängigkeit und Abhängigkeit der Servicequalität von den Gehältern der wartenden Personen.
  • H 0 - Die Servicequalität hängt nicht von den Gehältern der Personen ab, die auf die Tische warten.
  • H 1 - Die Servicequalität hängt von den Gehältern der Personen ab, die auf die Tische warten
  • Ihre Ergebnisse sind in der folgenden Tabelle aufgeführt:

In diesem haben wir 9 Datenpunkte, wir haben 3 Gruppen, von denen jede eine andere Nachricht über das Gehalt erhalten hat und das Ergebnis ist unten angegeben.

Jetzt zählen wir die Summe aller Zeilen und Spalten. Wir werden dies mit Hilfe der Formel dh SUM tun . Um das Ausgezeichnete in der Gesamtspalte zu summieren, haben wir = SUMME (B4: D4) geschrieben und dann die Eingabetaste gedrückt.

Dies wird uns 26 geben . Wir werden das gleiche mit allen Zeilen und Spalten durchführen.

Zur Berechnung des Freiheitsgrades (DF) verwenden wir (r-1) (c-1)

DF = (3-1) (3-1) = 2 · 2 = 4

  • Es gibt 3 Kategorien von Dienstleistungen und 3 Kategorien von Gehältern
  • Wir haben 27 Befragte mit einem mittleren Gehalt (untere Reihe, Mitte)
  • Wir haben 51 Befragte mit einem guten Service (letzte Spalte, Mitte)

Jetzt müssen wir die erwarteten Frequenzen berechnen : -

Erwartete Häufigkeiten können nach folgender Formel berechnet werden:

  • Um das Excellent zu berechnen , multiplizieren wir die Summe von Low mit der Summe von Excellent geteilt durch N.

Angenommen, wir müssen für die 1. Zeile und 1. Spalte berechnen (= B7 * E4 / B9 ) . Dies ergibt die erwartete Anzahl von Kunden, die für die Gehälter der wartenden Personen einen hervorragenden Service gewählt haben, dh 8,32 .

  • E 11 = (32 · 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

In ähnlicher Weise müssen wir für alle dasselbe tun und die Formel wird im folgenden Diagramm angewendet.

Wir erhalten die Tabelle mit den erwarteten Frequenzen wie folgt: -

Hinweis: - Angenommen, das Signifikanzniveau beträgt 0,05. Hier bezeichnen H0 und H1 die Unabhängigkeit und Abhängigkeit der Servicequalität von den Gehältern der wartenden Personen.

Nach der Berechnung der erwarteten Frequenz berechnen wir die Chi-Quadrat-Datenpunkte mithilfe einer Formel

Chi-Quadrat-Punkte = (beobachtet-erwartet) ^ 2 / erwartet

Um den ersten Punkt zu berechnen, schreiben wir = (B4-B14) ^ 2 / B14. 

Wir werden die Formel kopieren und in andere Zellen einfügen, um den Wert automatisch zu füllen.

Danach berechnen wir den Chi-Wert (berechneter Wert), indem wir alle über der Tabelle angegebenen Werte addieren

Wir haben den Chi-Wert als 18.65823 erhalten .

Um den kritischen Wert dafür zu berechnen, verwenden wir eine Chi-Quadrat-Tabelle für kritische Werte. Wir können die unten angegebene Formel verwenden.

Diese Formel enthält 2 Parameter CHISQ.INV.RT (Wahrscheinlichkeit, Freiheitsgrad).

Die Wahrscheinlichkeit ist 0,05, ein signifikanter Wert, mit dessen Hilfe wir feststellen können, ob die Nullhypothese (H 0 ) akzeptiert werden soll oder nicht.

Der kritische Wert von Chi-Quadrat ist 9.487729037.

Jetzt finden wir den Wert des Chi-Quadrats oder (P-Wert) = CHITEST (tatsächlicher_Bereich, erwarteter_Bereich)

Bereich von = CHITEST (B4: D6, B14: D16) .

Wie wir gesehen haben, ist der Wert des Chi-Tests oder P-Werts = 0,00091723.

Wie wir gesehen haben, haben wir alle Werte berechnet. Die Chi-Quadrat- Werte (berechneter Wert) sind nur dann signifikant, wenn ihr Wert gleich oder größer als der kritische Wert 9,48 ist, dh der kritische Wert (tabellarischer Wert) muss höher als 18,65 sein , um die Nullhypothese (H 0 ) zu akzeptieren .

Aber hier Berechneter Wert > Tabellarischer Wert

X2 (berechnet)> X2 (tabellarisch)

18,65> 9,48

In diesem Fall lehnen wir die Nullhypothese (H 0 ) ab und Alternative (H 1 ) wird akzeptiert.

  • Wir können auch den P-Wert verwenden, um dasselbe vorherzusagen, dh wenn der P-Wert <= α (signifikanter Wert 0,05) ist, wird die Nullhypothese verworfen
  • Wenn der P-Wert> α ist , lehnen Sie die  Nullhypothese nicht ab .

Hier P-Wert (0.0009172) < α (0,05), ablehnen H 0 , H akzeptieren 1

Aus dem obigen Beispiel schließen wir, dass die Servicequalität von den Gehältern der wartenden Personen abhängt.

Dinge, an die man sich erinnern sollte

  • Betrachtet das Quadrat einer normalen Standardvariablen.
  • Bewertet, ob die in verschiedenen Kategorien beobachteten Häufigkeiten erheblich von den unter bestimmten Annahmen erwarteten Häufigkeiten abweichen.
  • Legt fest, wie gut eine angenommene Verteilung zu den Daten passt.
  • Verwendet Kontingenztabellen (in Marktforschungen werden diese Tabellen als Kreuztabellen bezeichnet).
  • Unterstützt Messungen auf Nennniveau.