la teoría detrás de los valores p y la hipótesis nula puede parecer complicada al principio, pero comprender los conceptos lo ayudará a navegar por el mundo de las estadísticas. Desafortunadamente, estos términos son a menudo mal utilizados en la ciencia popular, por lo que sería útil para todos entender los conceptos básicos.
calcular el valor p de un modelo y probar / refutar la hipótesis nula es sorprendentemente simple con MS Excel. Hay dos maneras de hacerlo y cubriremos las dos. Vamos a cavar.,
hipótesis nula y valor p
la hipótesis nula es una declaración, también conocida como posición predeterminada, que afirma que la relación entre los fenómenos observados es inexistente. También se puede aplicar a asociaciones entre dos grupos observados. Durante la investigación, usted prueba esta hipótesis y trata de refutarla.
por ejemplo, supongamos que desea observar si una dieta de moda en particular tiene resultados significativos. La hipótesis nula, en este caso, es que no hay diferencia significativa en el peso de los sujetos de prueba antes y después de la dieta., La hipótesis alternativa es que la dieta hizo una diferencia. Esto es lo que los investigadores intentarían probar.
el valor P representa la posibilidad de que el resumen estadístico sea igual o mayor que el valor observado cuando la hipótesis nula es verdadera para un determinado modelo estadístico. Aunque a menudo se expresa como un número decimal, generalmente es mejor expresarlo como un porcentaje. Por ejemplo, el valor p de 0.1 debe representarse como 10%.
un valor p bajo significa que la evidencia contra la hipótesis nula es fuerte. Esto significa además que sus datos son significativos., Por otro lado, un valor p alto significa que no hay evidencia fuerte contra la hipótesis. Para probar que la dieta de moda funciona, los investigadores tendrían que encontrar un valor p bajo.
un resultado estadísticamente significativo es el que es altamente improbable que ocurra si la hipótesis nula es verdadera. El nivel de significancia se denota con la letra griega alfa y tiene que ser mayor que el valor p para que el resultado sea estadísticamente significativo.
muchos investigadores en una amplia gama de campos utilizan el valor p para obtener una visión mejor y más profunda de los datos con los que están trabajando., Algunos de los campos prominentes incluyen la sociología, la justicia penal, la psicología, las finanzas y la economía.
encontrar el valor p en Excel
Puede encontrar el valor p de un conjunto de datos en MS Excel a través de la función t-Test o utilizando la herramienta de análisis de datos. Primero, veremos la función t-Test. Examinaremos a cinco estudiantes universitarios que hicieron una dieta de 30 días. Compararemos su peso antes y después de la dieta.
Nota: para los propósitos de este artículo, usaremos MS Excel 2010. Aunque no es el más reciente, los pasos generalmente deben aplicarse a las versiones más nuevas, también.,
función t-Test
siga estos pasos para calcular el valor p con la función t-Test.
- Crear y rellenar la tabla. Nuestra tabla se ve así:
- haga clic en cualquier celda fuera de su tabla.
- escriba: = T. Test(.
- Después del corchete abierto, escriba el primer argumento. En este ejemplo, es la columna antes de la dieta. El rango debe ser B2: B6. Hasta ahora, la función se ve así: T. Test(B2:B6.,
- a continuación, introduciremos el segundo argumento. La columna después de la dieta y sus resultados son nuestro segundo argumento y el rango que necesitamos es C2: C6. Vamos a añadirlo a la fórmula: T. Test (B2: B6, C2: C6.
- escriba una coma después del segundo argumento y las opciones de distribución de una cola y de dos colas aparecerán automáticamente en un menú desplegable. Vamos a elegir la primera distribución de una cola. Haga doble clic en él.
- escriba otra coma.,
- haga doble clic en la opción emparejada en el siguiente menú desplegable.
- Ahora que tiene todos los elementos que necesita, cierre el corchete. La fórmula para este ejemplo se ve así: =T. Test (B2:B6,C2: C6,1,1)
- pulse Enter. La celda mostrará el valor p inmediatamente. En nuestro caso, el valor es 0.133905569 o 13.3905569%.
siendo superior al 5%, este valor de p no proporciona evidencia sólida contra la hipótesis nula., En nuestro ejemplo, la investigación no demostró que la dieta ayudara a los sujetos de prueba a perder una cantidad significativa de peso. Esto no significa necesariamente que la hipótesis nula sea correcta, solo que aún no ha sido refutada.
ruta de análisis de datos
la herramienta de análisis de datos le permite hacer muchas cosas interesantes, incluidos cálculos de valor p. Para simplificar las cosas, usaremos la misma tabla que en el método anterior.
así es como se hace.
- dado que ya tenemos las diferencias de peso en la columna D, nos saltaremos el cálculo de la diferencia., Para las tablas futuras, use esta fórmula: = «celda 1» – «celda 2».
- a continuación, haga clic en la pestaña Datos en el menú principal.
- Seleccione la herramienta de Análisis de Datos.
- desplácese hacia abajo en la lista y haga clic en la opción T-Test: pared Two Sample for Means.
- haga Clic en ACEPTAR.
- aparecerá una ventana emergente. Se parece a esto:
- Introduzca el primer rango/argumento. En nuestro ejemplo, es B2: B6.,
- Introduzca el segundo rango o argumento. En este caso, es C2: C6.
- deje el valor predeterminado en el cuadro de texto Alfa (es 0.05).
- haga clic en el botón de opción Rango de salida y elija dónde desea obtener el resultado. Si es la celda A8, escriba :A a 8 8.
- haga Clic en ACEPTAR.
- Excel calculará el valor de p y varios otros parámetros., La tabla final podría verse así:
Como puede ver, el valor p de una cola es el mismo que en el primer caso-0.133905569. Dado que está por encima de 0,05, la hipótesis nula se aplica a esta tabla, y la evidencia en su contra es débil.
cosas que debe saber sobre el valor p
Aquí hay algunos consejos útiles con respecto a los cálculos de valor p en Excel.
- si el valor de p es igual a 0.05 (5%), los datos de la tabla son significativos. Si es inferior a 0.05 (5%), los datos que tiene son altamente significativos.
- En caso de que el valor p sea superior a 0.,1 (10%), los datos en su tabla son insignificantes. Si está en el rango 0.05-0.10, tiene datos marginalmente significativos.
- Puede cambiar el valor alfa, aunque las opciones más comunes son 0.05 (5%) y 0.10 (10%).
- Elegir pruebas de dos colas puede ser la mejor opción, dependiendo de su hipótesis. En el ejemplo anterior, la prueba de una cola significa que exploramos si los sujetos de prueba perdieron peso después de hacer dieta, y eso es exactamente lo que necesitábamos averiguar. Pero una prueba de dos colas también examinaría si ganaron cantidades estadísticamente significativas de peso.,
- El valor p no puede identificar variables. En otras palabras, si identifica una correlación, no puede identificar las causas detrás de ella.
El valor-p desmitificado
cada estadístico digno de su sal tiene que saber los entresijos de la prueba de hipótesis nula y lo que significa el valor-p. Este conocimiento también será útil para los investigadores en muchos otros campos.