Transcript 11_nonpara
Non-parametrische Testverfahren Gliederung • Definition • Der χ² Test • Kolmogorov-Smirnov-Test • Überblick weitere Verfahren: – – – – – – – – Der Fisher-Yates-Test Der McNemar-Test Cochran-Test (Q-Test) Der Mediantest Der U-Test (Mann-Whitney Test) Vorzeichentest und Vorzeichenrangtest Der Friedman-Test Binominal-Test 11_nonpara 1 Non-parametrische Testverfahren Definition: • Nonparametrische (verteilungsfreie) Testverfahren setzen nicht eine bestimmte Verteilungsformen des erfassten Merkmals (z.B. Normalverteilung) voraus. • Nonparametrische Verfahren werden eingesetzt… für die Analyse von Ordinal- oder Nominalskalierten Variablen Wenn die Normalverteilungsannahme verletzt ist. • Parametrische Verfahren dürfen nur verwendet werden, wenn die beteiligten Variablen die gefordert Verteilungsform ausweisen (z.B. Normalverteilung für den t-Test). Sie haben in der Regel eine höher statistische Power. 11_nonpara 2 Der χ² -Test • Der χ²-Test („Chi-Quadrat-Test“) dient dem Vergleich von beobachteten und erwarteten Häufigkeiten. Er kann eingesetzt werden, wenn 1 oder 2 nominalskalierte unabhängige Variablen vorliegen. Beispiele: • Leiden Männer und Frauen gleich häufig an einer bestimmten Erkrankung? • Leisten hoch-ängstlich und gering-ängstliche Personen gleich häufig Hilfe in einer Notsituation? 11_nonpara 3 Der χ² -Test Voraussetzung für den χ² -Test (Faustregeln) (1) Weniger als 1/5 aller Zellen hat ein erwartete Häufigkeit kleiner als 5. (2) Keine Zelle weist eine erwartete Häufigkeit kleiner als 1 auf. Wenn diese Voraussetzungen nicht erfüllt sind, sollte alternativ der Fisher-Yates-Test verwendet werden. 11_nonpara 4 Der χ² -Test χ² -Test – Beispiel 1 • Es soll geprüft werden, ob die Verteilung von Männern und Frauen in einer Gruppe signifikant von einer Gleichverteilung abweicht. • N = 76 (Frauen: 56; Männer: 20) • Statistische Hypothesen – H0: π(Frau) = π(Mann) – H1: π(Frau) ≠ π(Mann) 11_nonpara 5 Der χ² -Test Schritt 1: • Zunächst werden die nach der H0 zu erwarteten Häufigkeiten berechnet: • Beobachtet: NF = 56; NM=20 • Erwartet: ??? – Gesamtzahl: 76 – Bei einer Gleichverteilung wären also 38 Männer und 38 Frauen zu erwarten. 11_nonpara 6 Der χ² -Test Schritt 2: • Nun wird der (empirische) χ²-Wert berechnet: k 2 df k 1 mit: • k: • fb,i: • fe,i: 11_nonpara i 1 f f e ,i 2 b ,i f e ,i Anzahl der Stufen der beiden Variablen Beobachtete Häufigkeit in der Zelle (i) Erwartete Häufigkeit in der Zelle (i) 7 Der χ² -Test Geschlecht Frau Mann Beobachtet 56 20 76 Erwartet 38 38 76 58 20 78 k 2 df k 1 df2 1 i 1 f f e ,i 2 b ,i f e ,i 2 2 2 56 38 20 38 182 18 8.53 8.53 17.05 11_nonpara 38 38 38 38 8 Der χ² -Test • Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen χ²-Wert. • Der kritische χ²-Wert wird in Abhängigkeit von den Freiheitsgraden und dem gewählten α-Niveau aus einer Tabelle zur χ²Verteilung abgelesen (Leonhart, S.448f). • Für α=.05 ergibt sich bei df=1: 2 emp 17.05 2 krit 5.02 • Die H0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden. 11_nonpara 9 Der χ² -Test Geschlecht χ² -Test – Beispiel 2 Angst Frau Mann gering 25 14 39 hoch 33 6 39 58 20 78 • Frage: Ist die (relative) Häufigkeit hoher bzw. geringer Ängstlichkeit bei Männern und Frauen gleich? • Statistische Hypothesen – H0: π(Angst | Frau) = π(Angst | Mann) – H1: π(Angst | Frau) ≠ π(Angst | Mann) 11_nonpara 10 Der χ² -Test Schritt 1: Zunächst werden aus den Randsummen die nach der H0 zu erwarteten Häufigkeiten geschätzt: Beobachtet: Geschlecht Angst Frau Mann gering 25 14 39 hoch 33 6 39 58 20 78 Erwartet: 11_nonpara f e(i , j ) f b (i.) f b (. j ) N N N f b (i.) f b (. j ) N Geschlecht Angst Frau Mann gering 29 10 39 hoch 29 10 39 58 20 78 11 Der χ² -Test Schritt 2: Nun wird der (empirische) χ²-Wert berechnet: k 2 df k i l 1 l i 1 j 1 f f e(i , j ) 2 b (i , j ) f e(i , j ) mit: • k, l: Anzahl der Stufen der beiden Variablen • fb(i,j): Beobachtete Häufigkeit in der Zelle (i,j) • fe(i,j): Erwartete Häufigkeit in der Zelle (i,j) 11_nonpara 12 Der χ² -Test Beobachtet: Erwartet: Geschlecht Geschlecht Angst Frau Mann gering 25 14 hoch 33 58 k l df2 k 1l 1 i 1 j 1 df2 1 Angst Frau Mann 39 gering 29 10 39 6 39 hoch 29 10 39 20 78 58 20 78 f b (i , j ) f e(i , j ) 2 f e(i , j ) 25 292 33 292 14 102 6 102 29 29 10 0.55 0.55 1.60 1.60 4.30 11_nonpara 10 13 Der χ² -Test • Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen χ²-Wert. • Der kritische χ²-Wert wird in Abhängigkeit von den Freiheitsgraden und dem gewählten α-Niveau aus einer Tabelle zur χ²Verteilung abgelesen (Leonhart, S.448f). • Für α=.05 ergibt sich bei df=1: 2 emp 4.30 2 krit 3.84 • Die H0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden. 11_nonpara 14 Der χ² -Test in SPSS 11_nonpara 15 Der χ² -Test in SPSS NPAR TEST /CHISQUARE=sex /EXPECTED=EQUAL 11_nonpara 16 Der χ² -Test in SPSS • SPSS-Ausgabe: sex 1 2 Gesamt Beobachtetes N Erwartete Anzahl 56 38,0 20 38,0 76 Residuum 18,0 -18,0 Statistik für Test sex Chi-Quadrat 17,053a df 1 Asymptotische Signifikanz ,000 a. Bei 0 Zellen (.0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 38.0. 11_nonpara 17 Der Kolmogorov-Smirnov-Test Der Kolmogorov-Smirnov-Test • Der Kolmogorov-Smirnov-Test vergleicht eine empirische Verteilung mit einer vorgegebenen theoretischen Verteilung (z.B. Normalverteilung). • Damit ist es möglich, die Voraussetzung parametrischer Testverfahren (z.B. für den t-Test) zu überprüfen. • Statistische Hypothesen: H0: Die Variable ist normalverteilt H1: Die Variable ist nicht normalverteilt 11_nonpara 18 Der Kolmogorov-Smirnov-Test in SPSS 11_nonpara 19 Der Kolmogorov-Smirnov-Test in SPSS NPAR TESTS /K-S(NORMAL)=freiburg psycho stat. 11_nonpara 20 Der Kolmogorov-Smirnov-Test in SPSS Kolmogorov-Smirnov-Anpassungstest freiburg psycho N 98 98 Parameter der Mittelwert 20,8163 19,7908 a Normalverteilung Standardabweichung 1,89055 3,04428 Extremste Differenzen Absolut ,182 ,124 Positiv ,104 ,063 Negativ -,182 -,124 Kolmogorov-Smirnov-Z 1,797 1,225 Asymptotische Signifikanz (2-seitig) ,003 ,099 a. Die zu testende Verteilung ist eine Normalverteilung. stat 98 16,5204 3,15650 ,111 ,057 -,111 1,098 ,179 Wenn p<.05 ist die Normalverteilungsannahme verletzt. 11_nonpara 21 Überblick weitere Verfahren: Stichproben Nominaskalen Ordinalskalen Unabhängig • χ² Test • Mediantest • Fisher-Yates-Test • U-Test (Mann-Whitney) • H-Test (Kruskal & Wallis) Abhängig • McNemar-Test • Vorzeichen-Test • Cochran-Test • Vorzeichen-Rang-Test (Wilkoxon) • Friedman-Test 11_nonpara 22 Der Fisher-Yates-Test Der Fisher-Yates-Test • Der Fisher-Yates Test wird eingesetzt, um Kontingenztabellen auszuwerten, wenn die Voraussetzungen des χ²-Test verletzt sind (d.h. bei geringen erwarteten Häufigkeiten). • Beispiel: Raucher Nichtraucher Frauen 20 40 Männer 3 5 • Berechnung: Siehe Leonhart (2004), Seite 162f 11_nonpara 23 McNemar-Test Der McNemar-Test • Der McNemar-Test wird für nominalskalierten Daten in zwei abhängigen Stichproben (z.B. Messwiederholung) verwendet . • Die erwarteten Häufigkeiten sollten nicht kleiner als 5 sein. • Beispiel: Veränderung des Rauchverhaltens von der Jugend bis ins Erwachsenenalter. Erwachsene Nichtraucher Raucher Σ Nichtraucher 33 3 36 Raucher 18 21 39 Σ 51 24 75 Jugend • Berechnung: Siehe Leonhart (2004), Seite 163f 11_nonpara 24 Cochran-Test (Q-Test) Der Cochran-Test (Q-Test) • Der Cochran-Test dient der Auswertung von nominalskalierten Daten in mehr als zwei abhängigen Stichproben. • Beispiel: (NR=Nichtraucher; R=Raucher) Alter (Jahre) Vp 12 16 20 24 28 1 NR R R R NR 2 NR R R R R 3 R R R R R 4 NR NR NR NR NR 5 NR NR R R R • Berechnung: Siehe Leonhart (2004), Seite 165f 11_nonpara 25 Mediantest Der Mediantest • Der Der Mediantest dient dem Vergleich der zentralen Tendenz ordinalskalierter Variablen, wenn zwei unabhängige Stichproben vorliegen. • Beispiel: Die Reaktionszeit bei einer Aufgabe soll zwischen Männern und Frauen verglichen werden (Da die Zeiten nicht normalverteilt sind, soll kein t-Test gerechnet werden) • Berechnung: Siehe Leonhart (2004), Seite 162f 11_nonpara 26 U-Test (Mann-Whitney-Test) Der U-Test (Mann-Whitney-Test) • Der U-Test vergleicht die zentrale Tendenz eines ordinalskalierten Merkmals zwischen zwei unabhängigen Zufallsstichproben. • Anmerkung: Der U-Test hat einer höhere Power als der Mediantest, jedoch ist er empfindlicher gegenüber Ausreißerwerten. • Beispiel: Der Therapieerfolg (Rating 1 bis 5) soll zwischen einer Therapiegruppe und einer „Wartekontrollgruppe“ verglichen werden. • Berechnung: Siehe Leonhart (2004), Seite 169f 11_nonpara 27 U-Test (Mann-Whitney-Test) 11_nonpara 28 U-Test (Mann-Whitney-Test) NPAR TESTS /M-W= freiburg BY sex(1 2) . 11_nonpara 29 U-Test (Mann-Whitney-Test) Ränge freiburg Geschlecht männlich weiblich Gesamt N Mittlerer Rang Rangsumme 21 41,57 873,00 75 50,44 3783,00 96 Statistik für Testa Mann-Whitney-U Wilcoxon-W Z Asymptotische Signifikanz (2-seitig) a. Gruppenvariable: Geschlecht freiburg 642,000 873,000 -1,312 ,189 Weil p>.05 besteht also kein bedeutsamer Rangunterschied. 11_nonpara 30 H-Test (Kruskal & Wallis -Test) Der H-Test (Kruskal & Wallis -Test) • Der U-Test vergleicht die zentrale Tendenz eines ordinalskalierten Merkmals zwischen zwei unabhängigen Zufallsstichproben. • Beispiel: Der Therapieerfolg soll zwischen drei Therapieverfahren sowie einer „Wartekontrollgruppe“ verglichen werden. Therapieerfolg Therapie A Therapie B Therapie C Wartekontrollgruppe 4 3 4 2 2 4 2 3 4 4 3 3 2 2 1 3 • Berechnung: Siehe Leonhart (2004), Seite 175ff 11_nonpara 31 Vorzeichentest und Vorzeichenrangtest Vorzeichentest und Vorzeichenrangtest • Der Vorzeichentest und der Vorzeichenrangtest nach Wilcoxon vergleichen, wie sich die Merkmalsausprägung eines ordinalskalierten Merkmals zwischen zwei abhängigen Stichproben unterscheiden. • Anmerkung: Der Vorzeichenrangtest nach Wilcoxon hat die höhere Power und ist daher generell zu bevorzugen. • Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe einer Reha-Maßnahme verbessert hat. Dabei wird die Arbeitsfähigkeit als 5-stufiges Rating vor und nach der Maßnahme erfasst. • Berechnung: Siehe Leonhart (2004), Seite 172ff 11_nonpara 32 Friedman-Test Der Friedman-Test • Der Friedman-Test vergleicht die Merkmalsausprägung eines ordinalskalierten Merkmals zwischen mehr als zwei abhängigen Stichproben. • Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe einer Reha-Maßnahme verbessert hat. Dabei wird die Arbeitsfähigkeit als 5-Stufiges Rating zu 3 Messzeitpunkten erfasst (prä-, post-, follow-up - Erhebung). • Berechnung: Siehe Leonhart (2004), Seite 177f 11_nonpara 33 Zusammenfassung • Nonparametrische Testverfahren können eingesetzt werden, wenn a) die vorliegenden Daten kein Intervallskalenniveau aufweisen oder b) die Normalverteilungsannahme der parametrischen Tests verletzt ist. • Der χ²-Test überprüft ob beobachtete und erwartete Häufigkeiten signifikant voneinander abweichen. • Der Kolmogorov-Smirnov-Test prüft, ob eine empirische Verteilung mit einer theoretisch vorgegebenen Verteilungsform (Normalverteilung) übereinstimmt. • Der U-Test vergleicht die mittleren Rangplätze zwischen 2 Gruppen. • Weitere Testverfahren können je nach Skalenniveau, Abhängigkeit der Stichprobe und Anzahl der Gruppen ausgewählt werden 11_nonpara 34