Artículo de Rosana Ferrero, Directora académica del Máster de data science en Máxima Formación

En la era del Big Data, una gran cantidad de datos es un activo para cualquier empresa o institución, pero solo si se procesan de manera eficiente. Se habla mucho de los algoritmos y los softwares estadísticos, pero la correcta interpretación de los resultados de un análisis puede ser aún más difícil. Incluso expertos en estadística suelen ser presa de ciertos errores comunes que hoy te contamos.
3. No seleccionar la prueba de hipótesis o el modelo de regresión correcto para tu objetivo
Una de las decisiones más básicas que se deben tomar al realizar una prueba de hipótesis es qué tipo de prueba de hipótesis se debe realizar. ¿Cuáles son las hipótesis a evaluar? ¿Cómo son las muestras/grupos que quiero analizar? ¿Qué tipo de prueba de hipótesis/modelo seleccionar? ¿Una cola o dos colas? ¿Qué hacer si mis datos no cumplen los supuestos?
Muchos analistas se sienten perdidos al iniciarse en este mundo, como si estuvieran circulando en bicicleta por una enorme autopista de alta velocidad sin señalizaciones. Están desorientados. No saben hacia dónde se dirigen (meta) y no cuentan con la destreza ni con el vehículo adecuado para transitar por ella (conocimientos y herramientas).
Para obtener el máximo potencial en esta autopista llamada Ciencia de Datos, tenemos que iniciar nuestro viaje con 3 capacidades en la maleta:
- La capacidad de definir nuestra meta: qué respuestas queremos obtener en nuestros análisis y por tanto cómo formulamos nuestras preguntas estadí
- La capacidad de saber elegir nuestras herramientas de análisis: Si tu única herramienta es un martillo, todos los problemas te parecerán un clavo. Esto es así también en la Ciencia de Datos, por eso es importante que conozcas un amplio abanico de herramientas, junto a sus debilidades y fortalezas. Para que puedas tomar las riendas de tu investigación y seleccionar el mejor modelo en cada caso.
- La capacidad de saber aplicar nuevos conocimientos disruptivos para tener el control durante todo el proceso de investigación. Es fundamental mejorar tus preguntas e inferencias estadísticas cuando realizas investigación empí Seleccionar y aplicar pruebas de hipótesis (paramétricas, no paramétricas y robustas) para evaluar las preguntas de tus investigaciones. Comprender el alcance de tus resultados en función del tamaño del efecto y la potencia estadística de tus análisis. Calcular y justificar de forma efectiva el tamaño de muestra que necesitas.
Conoce nuestra guía rápida para encontrar la prueba de hipótesis estadística que necesitas o cómo elegir el modelo de regresión que más se adecúa a tus objetivos y datos.
- Guía definitiva para encontrar la prueba estadística que buscas
- ¿Qué modelo de regresión debería elegir?
4. No distinguir la significación estadística de la significación práctica
Que exista una diferencia no significa que sea grande o importante. Algo puede ser estadísticamente significativo pero no ser significativo desde un punto de vista práctico, por tener un efecto pequeño o poco importante. Por ejemplo, las muestras muy grandes detectan diferencias muy pequeñas y a menudo poco relevantes (como ocurre en el Big Data).
Lo más interesante de los resultados es describirlos en términos de medidas de magnitud, no solo si un tratamiento afecta a las personas, sino en qué medida las afecta. A esto se le llama, tamaño del efecto y su ausencia en los artículos científicos es uno de los 7 fallos más comunes en investigación según la APA. Recuerda: El p-valor nos dice la dirección y el tamaño del efecto la magnitud de la diferencia.
Pero además, la correcta interpretación del tamaño del efecto dependerá del contexto y de la contribución de la investigación. En el contexto correcto un efecto pequeño puede ser importante:
- si desencadena grandes consecuencias o respuestas,
- si cambia la idea de que grandes resultados pueden ocurrir,
- si pequeños efectos pueden acumularse y producir grandes efectos,
- si conduce a un cambio de paradigma o a un quiebre tecnológico.
Y su contribución al conocimiento también es importante:
- si difiere de lo que otros investigadores han encontrado y si es así, en cuánto.
- si damos explicaciones alternativas para nuestros hallazgos.
- la importancia de un efecto depende de cuando ocurre, dónde ocurre y para quienes ocurre.
Conoce el tamaño de efecto y la potencia estadística, estima de manera rigurosa el tamaño de muestra que necesitas para tus investigaciones.
Siguientes dos pecados el próximo lunes 13 de diciembre de 2021 en Big Data Magazine
Siete pecados estadísticos que incluso los expertos cometen (I)