¿Qué es el valor P?
En estadística, el valor p es la probabilidad de obtener resultados al menos tan extremos como los resultados observados de una prueba de hipótesis estadística, asumiendo que la hipótesis nula es correcta. El valor p se utiliza como alternativa a los puntos de rechazo para proporcionar el menor nivel de significación al que se rechazaría la hipótesis nula. Un valor p más pequeño significa que hay una evidencia más fuerte a favor de la hipótesis alternativa.
Consignas clave
- Un valor p es una medida de la probabilidad de que una diferencia observada pueda haber ocurrido sólo por azar.
- Cuanto más bajo sea el valor p, mayor será la significación estadística de la diferencia observada.
- El valor p puede utilizarse como alternativa o complemento a los niveles de confianza preseleccionados para la comprobación de hipótesis.
¿Cómo se calcula el valor P?
Los valores P se suelen encontrar utilizando tablas de valores p u hojas de cálculo/software estadístico. Estos cálculos se basan en la distribución de probabilidad supuesta o conocida de la estadística específica que se está probando. Los valores p se calculan a partir de la desviación entre el valor observado y un valor de referencia elegido, dada la distribución de probabilidad de la estadística, con una mayor diferencia entre los dos valores que corresponde a un valor p más bajo.
Matemáticamente, el valor p se calcula utilizando el cálculo integral a partir del área bajo la curva de distribución de probabilidad para todos los valores de la estadística que están al menos tan lejos del valor de referencia como lo está el valor observado, en relación con el área total bajo la curva de distribución de probabilidad. En pocas palabras, cuanto mayor es la diferencia entre dos valores observados, menos probable es que la diferencia se deba al simple azar, y esto se refleja en un valor p más bajo.
Enfoque del valor P para la comprobación de hipótesis
El enfoque del valor p para la comprobación de hipótesis utiliza la probabilidad calculada para determinar si hay pruebas para rechazar la hipótesis nula. La hipótesis nula, también conocida como conjetura, es la afirmación inicial sobre una población (o proceso de generación de datos). La hipótesis alternativa establece si el parámetro de la población difiere del valor del parámetro de la población establecido en la conjetura.
En la práctica, el nivel de significación se establece de antemano para determinar lo pequeño que debe ser el valor p para rechazar la hipótesis nula. Dado que diferentes investigadores utilizan diferentes niveles de significación al examinar una cuestión, un lector puede tener a veces dificultades para comparar los resultados de dos pruebas diferentes. Los valores P proporcionan una solución a este problema.
Por ejemplo, suponga que un estudio que compara los rendimientos de dos activos concretos fue realizado por diferentes investigadores que utilizaron los mismos datos pero diferentes niveles de significación. Los investigadores podrían llegar a conclusiones opuestas respecto a si los activos difieren. Si un investigador utilizó un nivel de confianza del 90% y el otro requirió un nivel de confianza del 95% para rechazar la hipótesis nula y el valor p de la diferencia observada entre los dos rendimientos fue de 0,08 (correspondiente a un nivel de confianza del 92%), entonces el primer investigador encontraría que los dos activos tienen una diferencia que es estadísticamente significativa, mientras que el segundo no encontraría ninguna diferencia estadísticamente significativa entre los rendimientos.
Para evitar este problema, los investigadores podrían informar del valor p de la prueba de hipótesis y permitir que el lector interprete la significación estadística por sí mismo. Esto se llama un enfoque de valor p para la prueba de hipótesis. Un observador independiente podría anotar el valor p, y decidir por sí mismo si eso representa una diferencia estadísticamente significativa o no.
Ejemplo del mundo real del valor P
Supongamos que un inversor afirma que el rendimiento de su cartera de inversiones es equivalente al del índice Standard & Poor’s (S&P) 500. Para determinarlo, el inversor realiza una prueba de dos colas. La hipótesis nula afirma que los rendimientos de la cartera son equivalentes a los del S&P 500 durante un periodo determinado, mientras que la hipótesis alternativa afirma que los rendimientos de la cartera y los del S&P 500 no son equivalentes. (Si el inversor realizara una prueba de una cola, la hipótesis alternativa afirmaría que los rendimientos de la cartera son menores o mayores que los rendimientos del S&P 500.)
La prueba de hipótesis del valor P no hace uso necesariamente de un nivel de confianza preseleccionado en el que el inversor debería restablecer la hipótesis nula de que los rendimientos son equivalentes. En su lugar, proporciona una medida de cuánta evidencia hay para rechazar la hipótesis nula. Cuanto menor sea el valor p, mayor será la evidencia contra la hipótesis nula. Por lo tanto, si el inversor encuentra que el valor p es 0,001, hay una fuerte evidencia contra la hipótesis nula, y el inversor puede concluir con confianza que los rendimientos de la cartera y los rendimientos del S&P 500 no son equivalentes.
Aunque esto no proporciona un umbral exacto sobre cuándo el inversor debe aceptar o rechazar la hipótesis nula, tiene otra ventaja muy práctica. La prueba de hipótesis del valor P ofrece una forma directa de comparar la confianza relativa que el inversor puede tener al elegir entre múltiples tipos diferentes de inversiones o carteras, en relación con un punto de referencia como el S&P 500.
Por ejemplo, para dos carteras, A y B, cuyo rendimiento difiere del S&P 500 con valores p de 0,10 y 0,01 respectivamente, el inversor puede estar mucho más seguro de que la cartera B, con un valor p más bajo, mostrará realmente resultados consistentemente diferentes.