Cos’è il P-Value?
In statistica, il valore p è la probabilità di ottenere risultati almeno altrettanto estremi di quelli osservati in un test di ipotesi statistica, assumendo che l’ipotesi nulla sia corretta. Il p-value è usato come alternativa ai punti di rifiuto per fornire il più piccolo livello di significatività al quale l’ipotesi nulla sarebbe rifiutata. Un p-value più piccolo significa che c’è una prova più forte a favore dell’ipotesi alternativa.
Key Takeaways
- Un p-value è una misura della probabilità che una differenza osservata possa essere avvenuta solo per caso.
- Più basso è il valore p, maggiore è la significatività statistica della differenza osservata.
- Il valore p può essere usato come alternativa o in aggiunta ai livelli di confidenza preselezionati per i test di ipotesi.
Come si calcola il valore p?
I valori P sono di solito trovati usando le tabelle dei p-valori o i fogli di calcolo/software statistici. Questi calcoli si basano sulla distribuzione di probabilità presunta o nota della statistica specifica da testare. I valori p sono calcolati dalla deviazione tra il valore osservato e un valore di riferimento scelto, data la distribuzione di probabilità della statistica, con una maggiore differenza tra i due valori corrispondente a un valore p più basso.
Matematicamente, il valore p è calcolato usando il calcolo integrale dall’area sotto la curva di distribuzione della probabilità per tutti i valori della statistica che sono almeno tanto lontani dal valore di riferimento quanto lo è il valore osservato, rispetto all’area totale sotto la curva di distribuzione della probabilità. In poche parole, maggiore è la differenza tra due valori osservati, meno probabile è che la differenza sia dovuta al semplice caso, e questo si riflette in un valore p più basso.
Approccio del valore P al test delle ipotesi
L’approccio del valore p al test delle ipotesi utilizza la probabilità calcolata per determinare se ci sono prove per rifiutare l’ipotesi nulla. L’ipotesi nulla, nota anche come congettura, è l’affermazione iniziale su una popolazione (o processo di generazione dei dati). L’ipotesi alternativa afferma se il parametro della popolazione differisce dal valore del parametro della popolazione dichiarato nella congettura.
In pratica, il livello di significatività è dichiarato in anticipo per determinare quanto piccolo deve essere il valore p per rifiutare l’ipotesi nulla. Poiché diversi ricercatori usano diversi livelli di significatività quando esaminano una questione, un lettore può talvolta avere difficoltà a confrontare i risultati di due test diversi. I valori P forniscono una soluzione a questo problema.
Per esempio, supponiamo che uno studio che confronta i rendimenti di due particolari attività sia stato intrapreso da ricercatori diversi che hanno usato gli stessi dati ma diversi livelli di significatività. I ricercatori potrebbero giungere a conclusioni opposte riguardo alla differenza tra gli asset. Se un ricercatore usasse un livello di confidenza del 90% e l’altro richiedesse un livello di confidenza del 95% per rifiutare l’ipotesi nulla e il p-value della differenza osservata tra i due rendimenti fosse 0,08 (corrispondente a un livello di confidenza del 92%), allora il primo ricercatore troverebbe che i due asset hanno una differenza statisticamente significativa, mentre il secondo non troverebbe alcuna differenza statisticamente significativa tra i rendimenti.
Per evitare questo problema, i ricercatori potrebbero riportare il p-value del test di ipotesi e permettere al lettore di interpretarne da solo la significatività statistica. Questo è chiamato un approccio p-value al test d’ipotesi. Un osservatore indipendente potrebbe notare il p-value, e decidere da solo se questo rappresenta una differenza statisticamente significativa o meno.
Esempio del mondo reale di P-Value
Assumiamo che un investitore sostenga che la performance del suo portafoglio di investimenti sia equivalente a quella dello Standard & Poor’s (S&P) 500 Index. Per determinarlo, l’investitore conduce un test a due code. L’ipotesi nulla afferma che i rendimenti del portafoglio sono equivalenti a quelli dell’S&P 500 in un determinato periodo, mentre l’ipotesi alternativa afferma che i rendimenti del portafoglio e quelli dell’S&P 500 non sono equivalenti. (Se l’investitore ha condotto un test a una coda, l’ipotesi alternativa dichiarerebbe che i rendimenti del portafoglio sono inferiori o superiori ai rendimenti del S&P 500.)
Il test di ipotesi del valore P non fa necessariamente uso di un livello di fiducia preselezionato al quale l’investitore dovrebbe azzerare l’ipotesi nulla che i rendimenti siano equivalenti. Invece, fornisce una misura di quante prove ci sono per rifiutare l’ipotesi nulla. Più piccolo è il valore p, maggiore è la prova contro l’ipotesi nulla. Quindi, se l’investitore trova che il p-value è 0,001, c’è una forte prova contro l’ipotesi nulla, e l’investitore può concludere con fiducia che i rendimenti del portafoglio e quelli dell’S&P 500 non sono equivalenti.
Anche se questo non fornisce una soglia esatta su quando l’investitore dovrebbe accettare o rifiutare l’ipotesi nulla, ha un altro vantaggio molto pratico. Il test d’ipotesi del valore P offre un modo diretto per confrontare la fiducia relativa che l’investitore può avere quando sceglie tra più tipi diversi di investimenti o portafogli, rispetto a un benchmark come l’S&P 500.
Per esempio, per due portafogli, A e B, la cui performance differisce dal S&P 500 con p-valori di 0,10 e 0,01 rispettivamente, l’investitore può essere molto più fiducioso che il portafoglio B, con un p-value inferiore, mostri effettivamente risultati coerentemente diversi.