Contacto

Ayudando a que los investigadores de los países en vías de desarrollo publiquen su trabajo

Cómo escoger la prueba estadística correcta

vista en miniatura de la imagen del artículo
Creado por AuthorAID Team | 1 de Septiembre de 2017  |

Abiodun Egbetokun, quien trabaja en el  National Centre for Technology Management en Ile-Ife, Nigeria, habla de un reto encontrado frecuentemente por estudiantes e investigadores al inicio de su carrera: la selección de las pruebas estadísticas apropiadas. En esta entrada, él nos ofrece cuatro consejos prácticos para tomar la decisión correcta. 

¿Qué tipo de análisis estadístico debo utilizar para mis datos? Como investigadores, esta es una pregunta a la que nos enfrentamos frecuentemente. A  lo largo de los años he desarrollado algunos pasos clave para decidir la prueba estadística más apropiada para mis datos, especialmente datos primarios.

Antes de proceder, sin embargo, permítanme hacer una observación general. Si sólo se hacen la pregunta de cómo analizar los datos cuando se encuentran a punto de empezar al análisis, ya es demasiado tarde. El análisis estadístico que decidan realizar influirá en el tipo de datos que colectarán, y ambas son decisiones que deben tomarse en la etapa de diseño experimental.

Abajo hay cuatro de los tips más importantes que he descubierto para seleccionar los métodos más apropiados para el análisis de datos:

1. Consideren su pregunta de investigación u objetivos

La historia que un investigador cuenta con un proyecto de investigación puede ser resumida en un enunciado o pregunta clara. Esta pregunta dictará los requisitos de los datos, y por lo tanto las posibles pruebas estadísticas que pueden aplicarse a los datos.

Imaginen, por ejemplo, que un equipo de investigación busca determinar si un nuevo medicamento anti-hipertensión es efectivo. Necesitarán datos sobre dos grupos de personas con hipertensión—uno que tome el medicamento y otro que no. Necesitarán colectar datos sobre los indicadores de la hipertensión en los dos grupos, antes y después de que el medicamento sea administrado. Para analizar estos datos, cualquier método que permita la comparación entre dos grupos funcionará bien. La prueba de  Chi cuadrada y la de  muestras independientes son sólo dos ejemplos.

2. Consideren el nivel de medición de las variables

Hay cuatro niveles de medición bien conocidos: nominales, ordinales, intervalos y  proporciones. Para una discusión detallada de cada uno de estos niveles, este  artículo por la Dra. Barbara Sommer, una profesora retirada de la Universidad de California, Davis, es un buen lugar para comenzar. El nivel que utilicen para medir su variable dependiente en su investigación determina las pruebas estadísticas u operaciones matemáticas que serán significativas.

Tomen los datos nominales como ejemplo. Estos datos no pueden medirse u ordenarse, pero puede colocarse en categorías determinadas—por ejemplo, región o nacionalidad—y como tal, sólo puede representarse como frecuencias o porcentajes. Mientras, los datos de proporciones (por ejemplo, ingresos, distancia) pueden analizarse mediante casi cualquier técnica estadística. Por ejemplo, no sería lógico utilizar media o promedio para analizar nacionalidad, pero la distancia promedio sí tiene sentido. Es mala práctica aplicar estadística basada en el promedio para variables basadas en escalas de Likert.

3. Consideren la distribución de la variable resultante

La distribución se refiere a todos los valores posibles de los datos y que tan frecuentemente ocurren. Un buen entendimiento de las distribuciones es muy importante para el análisis de datos. Para una discusión más detallada sobre la distribución, revisen este  artículo, por Aswath Damodaran, Profesor de finanzas en New York University.

Viarias distribuciones  son relevantes para propósitos estadísticos, y cada método estadístico se construye según una distribución particular. Por ejemplo, las pruebas t se construyen con base en una distribución normal estándar, mientras que la regresión  logística se construye con base en una distribución logística. La mejor prueba estadística a aplicar depende de la distribución de la variable resultante. Si la variable sigue una distribución normal (por ejemplo, peso, estatura o IQ), una regresión lineal o una prueba t funcionará bien. Por otro lado, si es una variable binaria (por ejemplo si alguien tiene o no una enfermedad), entonces una prueba Chi cuadrada o una prueba de proporciones será más apropiada. 

Muchas veces, ha visto artículos en los que los autores aplican una regresión lineal a una variable que no tiene distribución normal, reflejando escaso conocimiento de la distribución. Además, es importante añadir que las distribuciones y los niveles de medición están muy relacionados—el nivel de medición de una variable define su distribución. Por ejemplo, una variable discreta casi nunca tienen una distribución normal.

4. Consideren cualquier peculiaridad específica de la variable resultante

Algunas veces los datos tendrán peculiaridades que no deben ignorarse al momento del análisis de los datos. Por ejemplo, es posible que los valores de la variable no sean observables por encima de un límite (por ejemplo, cuando una persona pesa más que el máximo posible para una báscula de baño). Esto se llama censura – y es importante seleccionar un método estadístico que considere este caso.

Otras veces, es posible que nuestros datos discretos contengan muchos valores en cero (por ejemplo,  número de patentes por cada individuo en una población de científicos). Esto se conoce como inflación por cero zero-inflation.  Algunas veces, los ceros vienen de diferentes procesos (por ejemplo cuando un individuo tiene cero patentes porque no son inventores, o cuando un inventor ni tiene ninguna patente). Hay técnicas específicas para manejar este tipo de datos, y otras técnicas no darán resultados significativos.

En resumen, mis cuatro consejos para seleccionar las pruebas estadísticas no son exhaustivos. Sin embargo, proveen un marco de referencia útil para que los investigadores consideren el análisis significativo de los datos. Para saber más sobre el tema, he encontrado que ell sitio web del  UCLA’s Institute for Digital Research and Education es muy útil.

Abiodun Egbetokun tiene un doctorado en Economía  y otros grados en Ingeniería Mecánica y Manejo de Tecnología. Es Jefe del Departamento de Estudios de Política de la Ciencia e Innovación en Ile-Ife, Nigeria. Para saber más sobre él visiten: www.egbetokun.com.

blog comments powered by Disqus

Eventos Próximos

No hay eventos disponibles