Co to jest P-wartość?
W statystyce, wartość p jest prawdopodobieństwem uzyskania wyników co najmniej tak skrajnych, jak obserwowane wyniki testu hipotezy statystycznej, przy założeniu, że hipoteza zerowa jest poprawna. Wartość p jest używana jako alternatywa dla punktów odrzucenia, aby podać najmniejszy poziom istotności, przy którym hipoteza zerowa zostałaby odrzucona. Mniejsza wartość p oznacza, że istnieją silniejsze dowody na korzyść hipotezy alternatywnej.
Key Takeaways
- Wartość p jest miarą prawdopodobieństwa, że zaobserwowana różnica mogła wystąpić tylko przez przypadek.
- Im niższa wartość p, tym większa istotność statystyczna zaobserwowanej różnicy.
- Wartość p może być stosowana jako alternatywa lub dodatek do wcześniej wybranych poziomów ufności dla testowania hipotez.
Jak oblicza się wartość p?
Wartości P są zwykle znajdowane przy użyciu tabel wartości p lub arkuszy kalkulacyjnych/oprogramowania statystycznego. Obliczenia te opierają się na założonym lub znanym rozkładzie prawdopodobieństwa dla konkretnej testowanej statystyki. Wartości p są obliczane na podstawie odchylenia między wartością obserwowaną a wybraną wartością odniesienia, biorąc pod uwagę rozkład prawdopodobieństwa statystyki, przy czym większa różnica między tymi dwiema wartościami odpowiada niższej wartości p.
Matematycznie, wartość p jest obliczana przy użyciu rachunku całkowego z obszaru pod krzywą rozkładu prawdopodobieństwa dla wszystkich wartości statystyki, które są co najmniej tak daleko od wartości odniesienia, jak wartość obserwowana, w stosunku do całkowitego obszaru pod krzywą rozkładu prawdopodobieństwa. W skrócie, im większa jest różnica pomiędzy dwoma obserwowanymi wartościami, tym mniej prawdopodobne jest, że różnica ta wynika z prostego przypadku losowego, a to jest odzwierciedlone przez niższą wartość p.
Podejście do testowania hipotez
Podejście do testowania hipotez z wartością p wykorzystuje obliczone prawdopodobieństwo do określenia, czy istnieją dowody na odrzucenie hipotezy zerowej. Hipoteza zerowa, znana również jako przypuszczenie, jest początkowym twierdzeniem dotyczącym populacji (lub procesu generowania danych). Hipoteza alternatywna stwierdza, czy parametr populacji różni się od wartości parametru populacji podanej w przypuszczeniu.
W praktyce poziom istotności jest podawany z góry, aby określić, jak mała musi być wartość p, aby odrzucić hipotezę zerową. Ponieważ różni badacze używają różnych poziomów istotności przy badaniu danego zagadnienia, czytelnik może mieć czasem trudności z porównaniem wyników dwóch różnych testów. Wartości P stanowią rozwiązanie tego problemu.
Na przykład, załóżmy, że badanie porównujące zwroty z dwóch konkretnych aktywów zostało podjęte przez różnych badaczy, którzy wykorzystali te same dane, ale różne poziomy istotności. Badacze mogą dojść do przeciwnych wniosków dotyczących tego, czy aktywa różnią się między sobą. Jeśli jeden badacz użył poziomu ufności 90%, a drugi wymagał poziomu ufności 95% do odrzucenia hipotezy zerowej, a wartość p dla zaobserwowanej różnicy między dwoma zwrotami wyniosła 0,08 (co odpowiada poziomowi ufności 92%), wówczas pierwszy badacz stwierdziłby, że te dwa aktywa różnią się w sposób statystycznie istotny, podczas gdy drugi nie stwierdziłby żadnej statystycznie istotnej różnicy między zwrotami.
Aby uniknąć tego problemu, badacze mogliby podać wartość p testu hipotezy i pozwolić czytelnikowi na samodzielną interpretację istotności statystycznej. Nazywa się to podejściem p-wartościowym do testowania hipotez. Niezależny obserwator mógłby zanotować wartość p i sam zdecydować, czy reprezentuje ona statystycznie istotną różnicę, czy nie.
Przykład ze świata rzeczywistego dotyczący wartości p
Załóżmy, że inwestor twierdzi, że wyniki jego portfela inwestycyjnego są równoważne wynikom indeksu Standard & Poor’s (S&P) 500 Index. Aby to ustalić, inwestor przeprowadza test dwuogonowy. Hipoteza zerowa stwierdza, że zwroty portfela są równoważne ze zwrotami indeksu S&P 500 w określonym okresie, natomiast hipoteza alternatywna stwierdza, że zwroty portfela i zwroty indeksu S&P 500 nie są równoważne. (Jeśli inwestor przeprowadziłby test jednoogonowy, hipoteza alternatywna stwierdzałaby, że zwroty portfela są albo mniejsze albo większe niż zwroty S&P 500.)
Test hipotezy P-value niekoniecznie wykorzystuje wcześniej wybrany poziom ufności, przy którym inwestor powinien zrewidować hipotezę zerową, że zwroty są równoważne. Zamiast tego, stanowi on miarę tego, jak wiele dowodów przemawia za odrzuceniem hipotezy zerowej. Im mniejsza wartość p, tym większe dowody przemawiają przeciwko hipotezie zerowej. Tak więc, jeśli inwestor stwierdzi, że wartość p wynosi 0,001, istnieją silne dowody przeciwko hipotezie zerowej, a inwestor może śmiało stwierdzić, że zwroty portfela i zwroty S&P 500 nie są równoważne.
Ale nie zapewnia to dokładnego progu, kiedy inwestor powinien zaakceptować lub odrzucić hipotezę zerową, ma inną bardzo praktyczną zaletę. Testowanie hipotez z wartością P oferuje bezpośredni sposób na porównanie względnej pewności, jaką inwestor może mieć przy wyborze spośród wielu różnych rodzajów inwestycji lub portfeli, w stosunku do benchmarku takiego jak S&P 500.
Na przykład, dla dwóch portfeli, A i B, których wyniki różnią się od S&P 500 z wartościami p odpowiednio 0,10 i 0,01, inwestor może być znacznie bardziej pewny, że portfel B, z niższą wartością p, będzie rzeczywiście wykazywał konsekwentnie różne wyniki.