Wat is P-Value?

In de statistiek is de p-waarde de kans op resultaten die ten minste even extreem zijn als de waargenomen resultaten van een statistische hypothesetest, aangenomen dat de nulhypothese correct is. De p-waarde wordt gebruikt als een alternatief voor verwerpingspunten om het kleinste significantieniveau aan te geven waarop de nulhypothese zou worden verworpen. Een kleinere p-waarde betekent dat er sterker bewijs is ten gunste van de alternatieve hypothese.

Key Takeaways

  • Een p-waarde is een maat voor de waarschijnlijkheid dat een waargenomen verschil alleen door willekeurig toeval zou kunnen zijn ontstaan.
  • Hoe lager de p-waarde, des te groter de statistische significantie van het waargenomen verschil.
  • De p-waarde kan worden gebruikt als alternatief voor of aanvulling op vooraf ingestelde betrouwbaarheidsniveaus voor het toetsen van hypothesen.

Hoe wordt de p-waarde berekend?

P-waarden worden gewoonlijk gevonden met behulp van p-waardetabellen of spreadsheets/statistische software. Deze berekeningen zijn gebaseerd op de veronderstelde of bekende kansverdeling van de specifieke statistiek die wordt getest. P-waarden worden berekend uit de afwijking tussen de waargenomen waarde en een gekozen referentiewaarde, gegeven de waarschijnlijkheidsverdeling van de statistiek, waarbij een groter verschil tussen de twee waarden overeenkomt met een lagere p-waarde.

Mathematisch wordt de p-waarde met behulp van integraalrekening berekend uit het gebied onder de waarschijnlijkheidsverdelingscurve voor alle waarden van de statistiek die ten minste even ver van de referentiewaarde verwijderd zijn als de waargenomen waarde is, ten opzichte van het totale gebied onder de waarschijnlijkheidsverdelingscurve. Kort gezegd: hoe groter het verschil tussen twee waargenomen waarden, hoe minder waarschijnlijk het is dat het verschil aan gewoon toeval te wijten is, en dit komt tot uiting in een lagere p-waarde.

P-waarde benadering van hypothesetoetsing

De p-waarde benadering van hypothesetoetsing gebruikt de berekende waarschijnlijkheid om te bepalen of er bewijs is om de nulhypothese te verwerpen. De nulhypothese, ook wel het vermoeden genoemd, is de aanvankelijke bewering over een populatie (of een proces dat gegevens genereert). De alternatieve hypothese stelt of de parameter van de populatie verschilt van de waarde van de parameter van de populatie die in de conjectie wordt vermeld.

In de praktijk wordt het significantieniveau van tevoren aangegeven om te bepalen hoe klein de p-waarde moet zijn om de nulhypothese te verwerpen. Omdat verschillende onderzoekers verschillende significantieniveaus gebruiken bij het onderzoeken van een vraag, kan een lezer soms moeite hebben met het vergelijken van de resultaten van twee verschillende tests. P-waarden bieden een oplossing voor dit probleem.

Voorbeeld: stel dat een studie waarin de rendementen van twee bepaalde activa worden vergeleken, is uitgevoerd door verschillende onderzoekers die dezelfde gegevens maar verschillende significantieniveaus hebben gebruikt. De onderzoekers zouden tot tegengestelde conclusies kunnen komen over de vraag of de activa verschillen. Als de ene onderzoeker een betrouwbaarheidsniveau van 90% gebruikt en de andere een betrouwbaarheidsniveau van 95% om de nulhypothese te verwerpen en de p-waarde van het waargenomen verschil tussen de twee rendementen is 0,08 (wat overeenkomt met een betrouwbaarheidsniveau van 92%), dan zou de eerste onderzoeker vinden dat de twee activa een verschil hebben dat statistisch significant is, terwijl de tweede geen statistisch significant verschil tussen de rendementen zou vinden.

Om dit probleem te vermijden, zouden de onderzoekers de p-waarde van de hypothese test kunnen rapporteren en de lezer toestaan om de statistische significantie zelf te interpreteren. Dit wordt een p-waarde benadering van hypothesetoetsing genoemd. Een onafhankelijke waarnemer kan de p-waarde noteren, en zelf beslissen of dat een statistisch significant verschil is of niet.

Real-World Voorbeeld van P-Value

Stel dat een belegger beweert dat de prestatie van zijn beleggingsportefeuille gelijk is aan die van de Standard & Poor’s (S&P) 500 Index. Om dit te bepalen, voert de belegger een tweestaartstoets uit. De nulhypothese stelt dat het rendement van de portefeuille gelijkwaardig is aan het rendement van de S&P 500 over een bepaalde periode, terwijl de alternatieve hypothese stelt dat het rendement van de portefeuille en het rendement van de S&P 500 niet gelijkwaardig zijn. (Als de belegger een eenstaartstoets uitvoert, zou de alternatieve hypothese stellen dat het rendement van de portefeuille ofwel kleiner is dan of groter is dan het rendement van de S&P 500.)

P-hypothesetest maakt niet noodzakelijk gebruik van een vooraf gekozen betrouwbaarheidsniveau waarop de belegger de nulhypothese dat de rendementen gelijkwaardig zijn, moet resetten. In plaats daarvan geeft het een maatstaf voor hoeveel bewijs er is om de nulhypothese te verwerpen. Hoe kleiner de p-waarde, hoe groter het bewijs tegen de nulhypothese. Dus, als de belegger vindt dat de p-waarde 0,001 is, is er sterk bewijs tegen de nulhypothese, en de belegger kan met vertrouwen concluderen dat het rendement van de portefeuille en het rendement van de S&P 500 niet gelijkwaardig zijn.

Hoewel dit geen exacte drempel oplevert voor wanneer de belegger de nulhypothese moet accepteren of verwerpen, heeft het een ander zeer praktisch voordeel. Het testen van hypothesen op basis van de P-waarde biedt een directe manier om het relatieve vertrouwen te vergelijken dat de belegger kan hebben bij het kiezen uit meerdere verschillende soorten beleggingen of portefeuilles, ten opzichte van een benchmark zoals de S&P 500.

Bijvoorbeeld, voor twee portefeuilles, A en B, waarvan de prestaties verschillen van de S&P 500 met p-waarden van respectievelijk 0,10 en 0,01, kan de belegger er veel meer vertrouwen in hebben dat portefeuille B, met een lagere p-waarde ook daadwerkelijk consistent andere resultaten zal laten zien.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *