Cargando

Escriba aquí

(Traducción)

Por Vladica M. Veličković | July 31, 2013

Los investigadores deben tener cuidado con los errores más comunes del análisis de correlación a la hora de sacar conclusiones acerca de la naturaleza de los datos.

Las estadísticas son la base del análisis de los datos científicos y con la avalancha de datos procedentes de las nuevas tecnologías de genómica, la bioestadística realmente se ha convertido en una parte inseparable de la ciencia moderna. Sin embargo, una técnica estadística fundamental, el análisis de correlación, que mide la relación entre dos variables es empleada a menudo incorrectamente, lo que lleva a conclusiones erróneas sobre la verdadera naturaleza de la relación entre los fenómenos estudiados.

La tarea principal del análisis de correlación es probar una relación o acuerdo entre dos variables de interés, por ejemplo, el tabaquismo y una alta incidencia de cáncer de pulmón. Además, si el estudio se realiza sobre una muestra suficientemente grande, se puede hacer una evaluación aproximada del grado de correlación entre los fenómenos observados, cuantificando el coeficiente de correlación lineal.

Este coeficiente debe entonces ser interpretado y analizado críticamente, pues el análisis de correlación no pretende explicar la naturaleza del acuerdo cuantitativo, es decir, la relación de causalidad entre las dos variables. Además de asumir la causalidad, los investigadores caen comúnmente en otros dos errores: inferir la naturaleza del individuo sobre la base de los resultados de los grupos y pensar que una correlación de cero implica independencia. Cada uno de estos errores en el análisis puede llevar a conclusiones erróneas.

MITO # 1: La correlación implica causalidad

Todo científico sabe que “la correlación no implica causalidad.” De hecho, ambas variables pueden mostrar la misma tendencia de la variabilidad cuantitativa sin ninguna relación lógica y natural entre ellos. Alternativamente, dos variables pueden tener la misma tendencia desde que están bajo el impacto de los mismos factores de confusión que causan los cambios en ambos. Sin embargo, la suposición inapropiada de causalidad es la mayor fuente de error en la interpretación de los resultados del análisis de correlación.

En 2008, por ejemplo, el Journal of Pediatrics publicó un estudio en el cual los autores concluyeron que comer el desayuno puede resolver el problema de la obesidad en la adolescencia, basado simplemente en el hecho de que los adolescentes que desayunan son menos propensos a ser obesos. Aunque la correlación encontrada por los autores indica una posible relación de causalidad, es poco probable que comer el desayuno pueda resolver el posible problema de la obesidad adolescente. Lo más probable es que haya una causa común detrás de estos dos fenómenos (comer el desayuno y la obesidad en la adolescencia), la pobreza, por ejemplo, pero sin relación directa entre ellos.

Ejemplos similares de autores malinterpretando el coeficiente de correlación son comunes en la literatura epidemiológica. Un grupo de investigadores, por ejemplo, encontró una correlación entre las mujeres que toman terapia de reemplazo hormonal combinada (TRH) y una incidencia más baja que el promedio de la enfermedad cardíaca coronaria (CHD) y concluyó que la TRH disminuyó el riesgo de cardiopatía coronaria. Sin embargo, los ensayos controlados aleatorios han encontrado lo contrario: la TRH provocó el aumento en el riesgo de cardiopatía coronaria. Más tarde se determinó que la incidencia más baja que el promedio de la cardiopatía coronaria es causada por los beneficios asociados con un nivel socioeconómico medio más alto de los que tomaron TRH, no por la terapia en sí.

Estudios con este tipo de errores son publicados incluso en revistas biomédicas. Por ejemplo, un estudio en 1999 de la revista Nature encontró una fuerte asociación entre la miopía o casi miopía y la exposición a la luz ambiental nocturna durante el sueño en los niños. Los autores concluyeron que parece prudente que los bebés y los niños pequeños duerman en la noche sin iluminación artificial en el dormitorio. Un estudio posterior refutó estos resultados e informó que, en este caso, la causa de la miopía era genética, no del medio ambiente, ya que muchos de los padres de los participantes del estudio también sufrían de la afección.

Por supuesto, el hecho de que “la correlación no implica causalidad” no debe llevar a conclusiones diametralmente opuestas, porque la correlación podría señalar a una posible existencia de causalidad. Las correlaciones, especialmente el valor alto del coeficiente de correlación lineal, pueden indicar la existencia de causalidad, pero la conclusión requiere un examen sistemático.

MITO # 2: Las personas siguen al grupo

No siempre es posible hacer inferencias acerca de la naturaleza de los individuos a partir de la información sobre el grupo al que pertenecen. Muchos investigadores hacen estas suposiciones, cayendo víctimas de la falacia de inferencia ecológica.

Un ejemplo de la falacia de inferencia ecológica es un documento del 2012 del New England Journal of Medicine: el autor del estudio encontró que había una correlación lineal estrecha y significativa entre el consumo de chocolate per cápita y el número de premios Nobel por cada 10 millones de personas en un total de 23 países. Sobre la base de este resultado, se llegó a la conclusión de que el consumo de chocolate mejora la función cognitiva y estrechamente relacionado con el número de premios Nobel en cada país. Pero sin datos precisos a nivel individual es imposible sacar una conclusión. Por ejemplo, se desconoce si los premios Nobel consumían chocolate y cuánto.

MITO # 3: Una correlación de cero implica independencia

Con base en los dos ejemplos anteriores es claro que los valores altos del coeficiente de correlación lineal no pueden por sí mismos ser suficientes para concluir acerca de la relación entre las variables. A la inversa, un coeficiente de correlación de cero no significa que las variables sean independientes. Esto es debido a que el coeficiente de correlación mide la asociación lineal solamente. Una relación no monótona en forma de U, por ejemplo, puede tener una correlación de cero, tal como la relación dosis-respuesta mediada por el receptor en la expresión de genes de hormonas esteroides.

Conclusión

Adecuados, claros y de uso correcto, los métodos bioestadísticos requieren no solo un conocimiento adecuado de la bioestadística, sino también de la educación continua en este campo. En ese sentido, los bioestadistas entrenados en estos métodos deben participar en la investigación desde el principio, no después de que la medición, la observación o experimentos se han completado.

Vladica, M. Veličković es una asistente en el departamento de salud pública de la Universidad de Nis en la República de Serbia.

Fuente: http://www.the-scientist.com/?articles.view/articleNo/36781/title/Opinion–Statistical-Misconceptions/

Etiquetas

Leave a Comment

Your email address will not be published. Required fields are marked *