Qu’est-ce que la valeur P ?
En statistique, la valeur P est la probabilité d’obtenir des résultats au moins aussi extrêmes que les résultats observés d’un test d’hypothèse statistique, en supposant que l’hypothèse nulle est correcte. La valeur p est utilisée comme une alternative aux points de rejet pour fournir le plus petit niveau de signification auquel l’hypothèse nulle serait rejetée. Une valeur p plus petite signifie qu’il existe des preuves plus solides en faveur de l’hypothèse alternative.
Key Takeaways
- Une valeur p est une mesure de la probabilité qu’une différence observée ait pu se produire juste par hasard.
- Plus la valeur p est faible, plus la signification statistique de la différence observée est grande.
- La valeur p peut être utilisée comme une alternative ou en plus des niveaux de confiance présélectionnés pour les tests d’hypothèse.
Comment la valeur p est-elle calculée ?
Les valeurs P sont généralement trouvées à l’aide de tableaux de valeurs P ou de tableurs/logiciels statistiques. Ces calculs sont basés sur la distribution de probabilité supposée ou connue de la statistique spécifique testée. Les valeurs P sont calculées à partir de l’écart entre la valeur observée et une valeur de référence choisie, compte tenu de la distribution de probabilité de la statistique, une plus grande différence entre les deux valeurs correspondant à une valeur P plus faible.
Mathématiquement, la valeur P est calculée à l’aide du calcul intégral à partir de l’aire sous la courbe de distribution de probabilité pour toutes les valeurs de la statistique qui sont au moins aussi éloignées de la valeur de référence que l’est la valeur observée, par rapport à l’aire totale sous la courbe de distribution de probabilité. En un mot, plus la différence entre deux valeurs observées est grande, moins il est probable que cette différence soit due au simple hasard, ce qui se traduit par une valeur p plus faible.
Approche de la valeur p pour le test d’hypothèse
L’approche de la valeur p pour le test d’hypothèse utilise la probabilité calculée pour déterminer s’il existe des preuves pour rejeter l’hypothèse nulle. L’hypothèse nulle, également connue sous le nom de conjecture, est l’affirmation initiale concernant une population (ou un processus de génération de données). L’hypothèse alternative indique si le paramètre de la population diffère de la valeur du paramètre de la population énoncée dans la conjecture.
Dans la pratique, le niveau de signification est énoncé à l’avance pour déterminer à quel point la valeur p doit être petite pour rejeter l’hypothèse nulle. Étant donné que différents chercheurs utilisent différents niveaux de signification lorsqu’ils examinent une question, un lecteur peut parfois avoir des difficultés à comparer les résultats de deux tests différents. Les valeurs P apportent une solution à ce problème.
Par exemple, supposons qu’une étude comparant les rendements de deux actifs particuliers ait été entreprise par différents chercheurs qui ont utilisé les mêmes données mais des niveaux de signification différents. Les chercheurs pourraient arriver à des conclusions opposées quant à savoir si les actifs diffèrent. Si un chercheur a utilisé un niveau de confiance de 90 % et que l’autre a exigé un niveau de confiance de 95 % pour rejeter l’hypothèse nulle et que la valeur p de la différence observée entre les deux rendements était de 0,08 (correspondant à un niveau de confiance de 92 %), alors le premier chercheur trouverait que les deux actifs présentent une différence statistiquement significative, tandis que le second ne trouverait aucune différence statistiquement significative entre les rendements.
Pour éviter ce problème, les chercheurs pourraient signaler la valeur p du test d’hypothèse et permettre au lecteur d’interpréter lui-même la signification statistique. C’est ce qu’on appelle l’approche de la valeur p pour les tests d’hypothèse. Un observateur indépendant pourrait noter la valeur p et décider lui-même si cela représente une différence statistiquement significative ou non.
Exemple du monde réel de la valeur p
Supposons qu’un investisseur affirme que la performance de son portefeuille d’investissement est équivalente à celle de l’indice Standard & Poor’s (S&P) 500. Pour le déterminer, l’investisseur effectue un test bilatéral. L’hypothèse nulle indique que les rendements du portefeuille sont équivalents à ceux du S&P 500 sur une période donnée, tandis que l’hypothèse alternative indique que les rendements du portefeuille et ceux du S&P 500 ne sont pas équivalents. (Si l’investisseur effectuait un test unilatéral, l’hypothèse alternative indiquerait que les rendements du portefeuille sont soit inférieurs, soit supérieurs aux rendements du S&P 500.)
Le test d’hypothèse de la valeur P ne fait pas nécessairement appel à un niveau de confiance présélectionné auquel l’investisseur devrait réinitialiser l’hypothèse nulle selon laquelle les rendements sont équivalents. Au lieu de cela, il fournit une mesure de la quantité de preuves permettant de rejeter l’hypothèse nulle. Plus la valeur p est petite, plus les preuves contre l’hypothèse nulle sont importantes. Ainsi, si l’investisseur constate que la valeur p est de 0,001, il y a de fortes preuves contre l’hypothèse nulle, et l’investisseur peut conclure en toute confiance que les rendements du portefeuille et les rendements du S&P 500 ne sont pas être équivalents.
Bien que cela ne fournisse pas un seuil exact pour savoir quand l’investisseur doit accepter ou rejeter l’hypothèse nulle, cela présente un autre avantage très pratique. Le test d’hypothèse de la valeur P offre un moyen direct de comparer la confiance relative que l’investisseur peut avoir lorsqu’il choisit parmi plusieurs types d’investissements ou de portefeuilles différents, par rapport à un indice de référence tel que le S&P 500.
Par exemple, pour deux portefeuilles, A et B, dont les performances diffèrent de celles du S&P 500 avec des valeurs p respectives de 0,10 et 0,01, l’investisseur peut être beaucoup plus confiant dans le fait que le portefeuille B, avec une valeur p inférieure, présentera effectivement des résultats constamment différents.
.