t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (2024)

Der p-Wert gibt die Wahrscheinlichkeit an, dass das beobachtete Ergebnis oder ein noch extremeres Ergebnis eintritt, wenn die Nullhypothese wahr ist.

Mithilfe des p-Wertes wird entschieden, ob die Nullhypothese beibehalten oder abgelehnt wird. Ist der p-Wert kleiner als das festgelegte Signifikanzniveau (oft 5%) wird die Nullhypothese abgelehnt, sonst nicht.

Du möchtest eine Aussage über die Grundgesamtheit treffen und hast dafür eine Hypothese aufgestellt. Da es meistens nicht möglich ist, die gesamte Grundgesamtheit zu befragen, befragst du eine Stichprobe. Jetzt wird diese Stichprobe, aufgrund des Zufalls, sehr wahrscheinlich von der Grundgesamtheit abweichen.

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (1)

Sollte in deiner Grundgesamtheit die Nullhypothese gelten, z.B. das Gehalt von Männern und Frauen unterscheidet sich nicht in Deutschland, dann wird es in der Stichprobe sicherlich trotzdem einen Unterschied geben, z.B. einen Unterschied von 300 Euro pro Monat. Nun sagt dir der p-Wert wie wahrscheinlich es ist, dass in der Stichprobe zufällig ein Unterschied von 300 Euro oder mehr auftritt, wenn es in der Grundgesamtheit keinen Unterschied gibt.

Kommt eine sehr kleine Wahrscheinlichkeit raus, kann man sich natürlich fragen, ob die Annahme über die Grundgesamtheit überhaupt wahr ist.

Liegt der p-Wert z.B. bei 3%, dann ist es nur zu 3% wahrscheinlich, dass eine Stichprobe gezogen wird, in der das Gehalt von Männern und Frauen um mehr als 300 Euro auseinander liegt.

Wann wird der p-Wert verwendet?

Daher wird der p-Wert verwendet, um bei einem Hypothesentest die Nullhypothese entweder beizubehalten oder abzulehnen. Ist der berechnete p-Wert kleiner als ein vorher festgelegter Grenzwert (Signifikanzniveau), dann wird die Nullhypothese abgelehnt, ansonsten wird sie beibehalten.

Vereinfacht ausgedrückt: Egal welchen Hypothesentest man berechnet, der p-Wert ist das, was einem am Ende interessiert.

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (2)

Beispiel:

  • Die Nullhypothese ist, dass es keinen Unterschied zwischen dem Gehalt von Männern und Frauen gibt.
  • Nun wird eine Stichprobe mit dem Gehalt von Männern und Frauen gezogen. Dies sind unsere beobachteten Ergebnisse.
  • Wir gehen davon aus, dass die Nullhypothese wahr ist, also dass es keinen Unterschied zwischen dem Gehalt von Männern und Frauen gibt.
  • Bei dem beobachteten Ergebnis (Stichprobe) ist nun herausgekommen, dass Männer 150 € mehr im Monat verdienen als Frauen.
  • Der p-Wert gibt nun an, wie wahrscheinlich es ist, eine Stichprobe zu ziehen, in der sich das Gehalt von Männern und Frauen um 150€ oder mehr unterscheiden, obwohl es in der Grundgesamtheit keinen Unterschied gibt.
  • Ist der p-Wert z.B. 0,04, ist es nur zu 4% wahrscheinlich, eine Stichprobe zu ziehen die 150€ oder mehr auseinanderliegt, wenn es in der Grundgesamtheit keinen Unterschied im Gehalt gibt.

Sagen wir, im oberen Fall kommt ein p-Wert von 0,04 bzw. 4% heraus, was bedeutet dieser p-Wert nun? Vereinfacht gesagt bedeutet das Ergebnis, dass es, wenn in der Grundgesamtheit kein Unterschied im Gehalt vorliegt, nur zu 4% wahrscheinlich ist eine Stichprobe zu ziehen, die 150€ oder mehr auseinanderliegt.

Die Wahrscheinlichkeit von 4% ist natürlich sehr gering, sodass man sich fragen kann, ob es überhaupt stimmt, dass Männer und Frauen in der Grundgesamtheit gleich viel verdienen, oder ob diese Hypothese nicht lieber verworfen werden sollte.

Die Frage, ab wann die Nullhypothese verworfen wird beantwortet das Signifikanzniveau.

Signifikanzniveau

Das Signifikanzniveau wird vor dem Test festgelegt. Liegt der berechnete p-Wert unter diesem Wert, wird die Nullhypothese abgelehnt, ansonsten wird sie beibehalten. In der Regel wird ein Signifikanzniveau von 5 % gewählt. Das Signifikanzniveau wird auch mit alpha abgekürzt:

  • alpha < 0,01 : hoch signifikant
  • alpha < 0,05 : signifikant
  • alpha ≥ 0,05 : nicht signifikant

Das Signifikanzniveau gibt damit die Wahrscheinlichkeit für einen Fehler 1. Art an. Was bedeutet das nun? Liegt ein p-Wert von 5% vor und die Nullhypothese wird damit abgelehnt, ist die Wahrscheinlichkeit, dass die Nullhypothese doch gilt, 5% also es ist zu 5% wahrscheinlich, dass man einen Fehler macht. Wird der kritische Wert auf 1% herabgesetzt, liegt die Fehlerwahrscheinlichkeit dementsprechend nur noch bei 1%, es ist damit aber auch "schwerer", die Alternativhypothese zu bestätigen.

Einseitiger p-Wert

Sagen wir, du betrachtest die Reaktionszeit von zwei Gruppen. Dann ist oft nicht von Interesse, ob es einen Unterschied zwischen den beiden Gruppen gibt, sondern ob eine Gruppe einen größeren bzw. kleineren Wert hat als die andere. In diesem Fall hätte man eine gerichtete Hypothese aufgestellt und würde dann einen sogenannten einseitigen p-Wert berechnen.

Ein einseitiger p-Wert umfasst Werte, die in einer Richtung extremer sind als das erhaltene Ergebnis, wobei diese Richtung im Voraus angegeben wurde.

Ein zweiseitiger p-Wert schließt Werte ein, die sowohl in positiver als auch in negativer Richtung extremer sind.

Der einseitige p-Wert ergibt sich dann, indem der zweiseitige p-Wert durch 2 geteilt wird. Hierbei muss natürlich aufgepasst werden, ob der betrachtete Unterschied bzw. Effekt überhaupt in die Richtung der Alternativhypothese geht.

Beispiel

Deine Alternativhypothese ist, dass Gruppe A größere Werte bei der Reaktionszeit hat als Gruppe B. Beim Auswerten deiner Daten erhältst du einen zweiseitiger p-Wert von 0,04.

Nun muss geprüft werden, ob in deinen Daten wirklich die Gruppe A größere Werte hat. Ist dies der Fall, wird der zweiseitiger p-Wert durch zwei geteilt, also erhälst du 0,02.

Ist dies nicht der Fall und der Effekt bzw. Unterschied geht genau in die andere Richtung als in der Alternativhypothese formuliert, ergibt sich dein p-Wert mit 1-0,02 also mit 0,98

Keine Angst, wenn du DATAtab verwendest, kannst du angeben, welche Art von Hypothese du hast, und DATAtab hilft dir bei der Auswertung.

p-Wert berechnen

Für die Berechnung des p-Wertes muss zunächst ein passender Hypothesentest gefunden werden. Ist der passende Hypothesentest gefunden kannst du den p-Wert im Statistik Rechner auf DATAtab ausrechnen. Die bekanntesten Hypothesentests sind:

  • t-Test
  • Korrelationsanalyse
  • Chi-Quadrat-Test
  • Varianzanalyse

Für die Berechnung des p-Wertes wird eine Verteilungsfunktion benötigt, welche die Realisierungen bzw. Ziehungen der Stichprobe beschreibt. Ist diese Verteilungsfunktion bekannt, kann bestimmt werden, wie wahrscheinlich es ist, dass eine gezogene Stichprobe kleiner oder gleich einem betrachteten Wert ist. Klassische Vertreter dieser Verteilungen sind die t-Verteilung und die Chi-Quadrat-Verteilung.

t-Verteilung

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (3)

Chi-Quadrat-Verteilung

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (4)

Statistische Tests und der p-Wert

Damit man eine Hypothese verwerfen oder beibehalten kann benötigt man also den p-Wert. Der Ablauf wie der p-Wert für statistische Tests verwendet wird, ist nun folgender:

  • Festlegung des Signifikanzniveaus alpha z.B. 5 %
  • Festlegung eines statistischen Test-Verfahrens z.B. t-Test oder Korrelationsanalyse
  • Berechnung der Teststatistik von der Stichprobe z.B. den t Wert beim t-Test
  • Ermittlung des p-Wertes für die Teststatistik z.B. p-Wert für gegebenes t beim t-Test
  • Überprüfung ob, der p-Wert über oder unter dem festgelegten kritischem p-Wert liegt z.B. p-Wert 1% liegt unter dem kritischem Wert von 5%

Wie gebe ich den p-Wert an?

Wie der p-Werte aus einem Hypothesentest in Wissenschaftlichen Arbeiten dargestellt werden soll, ist nicht immer ganz klar. Unterschiedliche Statistikprogramme geben den p-Werte in unterschiedlichen Formaten aus, die teils für die Verschriftlichung nicht benötigt werden.

Rein theoretisch könnte der p-Wert auf eine nicht signifikant oder statistisch signifikant reduziert, was angemessen sein kann, wenn auch der Schätzwert und ein 95 %-Konfidenzintervall angegeben werden, aber im Allgemeinen liefert dies nicht genügend Informationen.

Wenn z.B. zwei p-Werte nahe der 0,05-Grenze liegen, einer knapp darüber und einer knapp darunter, sollte die Interpretation der beiden Werte nicht sehr unterschiedlich ausfallen. Wenn wir diese p-Werte auf eine binäre Antwort reduzieren und sagen, dass der eine signifikant ist und der andere nicht, ohne diese Aussage zu qualifizieren, riskieren wir, die von den Tests gelieferte Evidenz falsch darzustellen.

Daher ist es ratsam, den tatsächlichen p-Wert anzugeben, damit erhalten LeserInnen den größtmöglichen Einblick in die Ergebnisse.

Es ist üblich, die statistische Signifikanz in Form von Sternen anzugeben: * für p <0,05, ** für p <0,01, und *** für p <0,001. Im Allgemeinen wird für p-Werte Folgendes empfohlen:

  • Gib nach Möglichkeit den tatsächlichen P-Wert an.
  • Rundung: Zwei signifikante Stellen sind in der Regel ausreichend
t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (2024)

References

Top Articles
Latest Posts
Recommended Articles
Article information

Author: Reed Wilderman

Last Updated:

Views: 6184

Rating: 4.1 / 5 (52 voted)

Reviews: 83% of readers found this page helpful

Author information

Name: Reed Wilderman

Birthday: 1992-06-14

Address: 998 Estell Village, Lake Oscarberg, SD 48713-6877

Phone: +21813267449721

Job: Technology Engineer

Hobby: Swimming, Do it yourself, Beekeeping, Lapidary, Cosplaying, Hiking, Graffiti

Introduction: My name is Reed Wilderman, I am a faithful, bright, lucky, adventurous, lively, rich, vast person who loves writing and wants to share my knowledge and understanding with you.