Siete pecados estadísticos que incluso los expertos cometen (III)

Artículo de Rosana Ferrero, Directora académica del Máster de data science en Máxima Formación

Rosana Ferrero, Directora académica del Máster de data science en Máxima Formación

En la era del Big Data, una gran cantidad de datos es un activo para cualquier empresa o institución, pero solo si se procesan de manera eficiente. Se habla mucho de los algoritmos y los softwares estadísticos, pero la correcta interpretación de los resultados de un análisis puede ser aún más difícil. Incluso expertos en estadística suelen ser presa de ciertos errores comunes que hoy te contamos.

5. Desconocer el significado de la significación estadística

Decir que «se comprueba la hipótesis nula» o que «la hipótesis nula es cierta»

Así como la falta de evidencia no demuestra que el acusado es inocente, la falta de evidencia estadística (resultado no estadísticamente significativo o p>.05 para un nivel de significación del 5%) no demuestra que la hipótesis nula sea verdadera. Simplemente no hay suficiente evidencia para rechazar la hipótesis nula”. 

Los investigadores a menudo desean convertir un p-valor en una declaración sobre la verdad de la hipótesis nula, o sobre la probabilidad de que los datos se hayan producido por azar. Pero el p-valor no es ninguna de las dos cosas. Un p-valor mide la compatibilidad de una muestra con un modelo (con la hipótesis nula y los supuestos de la prueba), no la verdad o falsedad de la H0. Todo lo que el p-valor nos dice es si los datos son sorprendentes, si asumimos que la hipótesis nula es verdadera, que el procedimiento para obtener los datos y que los supuestos utilizados para calcular el p-valor son correctos. 

Decir que «el p-valor es la probabilidad de que la hipótesis nula sea cierta»

Las hipótesis son o no son. Lo que hace el p-valor es medir la fuerza de la evidencia contra H0. A menor p-valor, mayor evidencia contra H0.

Es la probabilidad de observar —a largo plazo- un efecto tan grande o más que el efecto observado (en el sentido de proporcionar evidencia contra la hipótesis nula) si el modelo que evaluamos es correcto (i.e. la hipótesis nula es cierta y los requisitos o supuestos de la prueba se cumplen!!!).

Cuanto más pequeño sea el 𝑝-valor, más fuerte es la evidencia proporcionada por los datos contra H0.

Los 𝑝-valores pueden ser herramientas útiles para realizar la inferencia, si se utilizan con precaución. Tal vez si comprendemos mejor los 𝑝-valores, podemos equivocarnos menos.

6. Considerar que el nivel de significación alfa=5% es un mandamiento

Toda la inferencia estadística se basa en una idea: para ver qué tan confiable es un procedimiento, nos preguntamos qué sucedería si lo repetimos muchas veces.

El nivel de significación alfa de 5% fue propuesto por el estadístico y biólogo británico Ronald Fisher en la década de 1920 (padre de la estadística moderna   del diseño experimental) para establecer que, si la H0 es verdadera y si repetimos el procedimiento un gran número de veces, la prueba estadística debería rechazar la H0 el 5% del tiempo o menos. Dicho de otro modo, estamos dispuestos a aceptar que hasta en 5 de 100 repeticiones del experimento, o en 1 de 20, las conclusiones de la prueba sean incorrectas.

El valor 5% es simplemente una convención conveniente, podría ser el 10% o el 1%, no existe un umbral real.

Es más, ningún experimento aislado, por significativo que sea en sí mismo, puede ser suficiente para la demostración experimental de cualquier fenómeno natural. La replicación es crucial.

Último pecado y conclusión el próximo lunes 20 de diciembre de 2021 en Big Data Magazine

Siete pecados estadísticos que incluso los expertos cometen (I)

Siete pecados estadísticos que incluso los expertos cometen (II)

TE PUEDE GUSTAR

EVENTOS

RECIBE NUESTRA NEWSLETTER

*Email:

*Nombre:

*Empresa:

Cargo:

Sector:
     

Please don't insert text in the box below!

ESCUCHA NUESTRO PODCAST

SÍGUENOS EN RRSS

MÁS COMENTADOS

Scroll al inicio