Was ist der P-Wert?
In der Statistik ist der p-Wert die Wahrscheinlichkeit, Ergebnisse zu erhalten, die mindestens so extrem sind wie die beobachteten Ergebnisse eines statistischen Hypothesentests, unter der Annahme, dass die Nullhypothese richtig ist. Der p-Wert wird als Alternative zu Verwerfungspunkten verwendet, um das kleinste Signifikanzniveau anzugeben, bei dem die Nullhypothese verworfen werden würde. Ein kleinerer p-Wert bedeutet, dass es stärkere Beweise für die Alternativhypothese gibt.
Key Takeaways
- Ein p-Wert ist ein Maß für die Wahrscheinlichkeit, dass ein beobachteter Unterschied nur durch Zufall entstanden sein könnte.
- Je niedriger der p-Wert ist, desto größer ist die statistische Signifikanz des beobachteten Unterschieds.
- Der p-Wert kann alternativ oder zusätzlich zu vorgewählten Konfidenzniveaus für Hypothesentests verwendet werden.
Wie wird der p-Wert berechnet?
P-Werte werden in der Regel mithilfe von p-Wert-Tabellen oder Tabellenkalkulationen/Statistiksoftware ermittelt. Diese Berechnungen basieren auf der angenommenen oder bekannten Wahrscheinlichkeitsverteilung der spezifischen Statistik, die getestet wird. P-Werte werden aus der Abweichung zwischen dem beobachteten Wert und einem gewählten Referenzwert unter Berücksichtigung der Wahrscheinlichkeitsverteilung der Statistik berechnet, wobei eine größere Differenz zwischen den beiden Werten einem niedrigeren p-Wert entspricht.
Mathematisch wird der p-Wert mit Hilfe der Integralrechnung aus der Fläche unter der Wahrscheinlichkeitsverteilungskurve für alle Werte der Statistik, die mindestens so weit vom Referenzwert entfernt sind wie der beobachtete Wert, relativ zur Gesamtfläche unter der Wahrscheinlichkeitsverteilungskurve berechnet. Kurz gesagt, je größer der Unterschied zwischen zwei beobachteten Werten ist, desto unwahrscheinlicher ist es, dass der Unterschied auf einfachen Zufall zurückzuführen ist, was sich in einem niedrigeren p-Wert widerspiegelt.
P-Wert-Ansatz für Hypothesentests
Der p-Wert-Ansatz für Hypothesentests verwendet die berechnete Wahrscheinlichkeit, um festzustellen, ob es Beweise für die Ablehnung der Nullhypothese gibt. Die Nullhypothese, auch Vermutung genannt, ist die ursprüngliche Aussage über eine Population (oder einen datenerzeugenden Prozess). Die Alternativhypothese gibt an, ob sich der Populationsparameter von dem in der Vermutung angegebenen Wert des Populationsparameters unterscheidet.
In der Praxis wird das Signifikanzniveau im Voraus angegeben, um zu bestimmen, wie klein der p-Wert sein muss, um die Nullhypothese zurückzuweisen. Da verschiedene Forscher bei der Untersuchung einer Frage unterschiedliche Signifikanzniveaus verwenden, kann ein Leser manchmal Schwierigkeiten haben, die Ergebnisse von zwei verschiedenen Tests zu vergleichen. P-Werte bieten eine Lösung für dieses Problem.
Angenommen, eine Studie zum Vergleich der Renditen von zwei bestimmten Vermögenswerten wurde von verschiedenen Forschern durchgeführt, die die gleichen Daten, aber unterschiedliche Signifikanzniveaus verwendeten. Die Forscher könnten zu entgegengesetzten Schlussfolgerungen kommen, ob sich die Assets unterscheiden. Wenn ein Forscher ein Konfidenzniveau von 90 % verwendet und der andere ein Konfidenzniveau von 95 % benötigt, um die Nullhypothese zurückzuweisen, und der p-Wert des beobachteten Unterschieds zwischen den beiden Renditen 0,08 beträgt (was einem Konfidenzniveau von 92 % entspricht), dann würde der erste Forscher feststellen, dass die beiden Vermögenswerte einen Unterschied aufweisen, der statistisch signifikant ist, während der zweite Forscher keinen statistisch signifikanten Unterschied zwischen den Renditen feststellen würde.
Um dieses Problem zu vermeiden, könnten die Forscher den p-Wert des Hypothesentests angeben und dem Leser erlauben, die statistische Signifikanz selbst zu interpretieren. Dies wird als p-Wert-Ansatz für Hypothesentests bezeichnet. Ein unabhängiger Beobachter könnte den p-Wert notieren und selbst entscheiden, ob dies einen statistisch signifikanten Unterschied darstellt oder nicht.
Real-World-Beispiel für den p-Wert
Angenommen, ein Investor behauptet, dass die Performance seines Investmentportfolios der des Standard & Poor’s (S&P) 500 Index entspricht. Um dies festzustellen, führt der Anleger einen zweiseitigen Test durch. Die Nullhypothese besagt, dass die Renditen des Portfolios äquivalent zu den Renditen des S&P 500 Index über einen bestimmten Zeitraum sind, während die Alternativhypothese besagt, dass die Renditen des Portfolios und des S&P 500 Index nicht äquivalent sind. (Wenn der Anleger einen einseitigen Test durchführt, würde die Alternativhypothese besagen, dass die Renditen des Portfolios entweder kleiner oder größer als die Renditen des S&P 500 sind.)
P-Wert-Hypothesentest verwendet nicht notwendigerweise ein vorgewähltes Konfidenzniveau, bei dem der Anleger die Nullhypothese zurücksetzen sollte, dass die Renditen gleichwertig sind. Stattdessen liefert er ein Maß dafür, wie viel Evidenz vorhanden ist, um die Nullhypothese zurückzuweisen. Je kleiner der p-Wert ist, desto größer ist die Evidenz gegen die Nullhypothese. Wenn der Anleger also feststellt, dass der p-Wert 0,001 ist, gibt es starke Beweise gegen die Nullhypothese, und der Anleger kann sicher schließen, dass die Renditen des Portfolios und des S&P 500 nicht gleichwertig sind.
Obwohl dies keinen genauen Schwellenwert liefert, wann der Anleger die Nullhypothese akzeptieren oder verwerfen sollte, hat es einen weiteren sehr praktischen Vorteil. Der P-Wert-Hypothesentest bietet eine direkte Möglichkeit, das relative Vertrauen zu vergleichen, das der Investor haben kann, wenn er zwischen mehreren verschiedenen Arten von Investitionen oder Portfolios wählt, relativ zu einer Benchmark wie dem S&P 500.
Beispielsweise kann der Anleger bei zwei Portfolios A und B, deren Performance sich vom S&P 500 mit p-Werten von 0,10 bzw. 0,01 unterscheidet, viel sicherer sein, dass Portfolio B, mit einem niedrigeren p-Wert, tatsächlich konsistent andere Ergebnisse zeigt.