Amàlia Gordovil Merino

Amàlia Gordóvil Merino

Estimacions bayesianes aplicades a models de regresió logística.

Becaria predoctoral del programa de Formaciónn de Investigadores de l'AGAUR (FI-DGR-2008).

Director del proyecto: Dr. Joan Guàrdia Olmos

Este proyecto nace del interés del grupo de investigación en la obtención de modelos estadísticos mucho más ajustados a la naturaleza y propiedades de los datos que la Psicología de base científica, tanto aplicada como básica, suele emplear. Para hacer un breve resumen de esta cuestión decir simplemente que la mayoría de variables derivadas de medidas psicométricas están construidas a partir de métricas de intervalo y que este presupuesto suele ser garantizado en los estudios psicométricos. Ahora bien, en muchos casos, las muestras empleadas y las medidas obtenidas presentan unas propiedades estadísticas y métricas que ponen en duda este tema. Por ejemplo, es habitual encontrar escalas de medida basadas en las estimaciones ordinales de los sujetos y, aún más habitual, en el sumatorio de una serie de ítems como generadores de una puntuación global en la escala. Esta opción, con unas propiedades psicométricas muy altas y siempre al amparo de una administración muy cuidadosa puede ser asumible. Cuando estos requisitos no se dan, el resultado estadístico puede ser sencillamente aberrante.


En esta línea de trabajo, focalizamos nuestra atención en un caso paradigmático de lo que hasta ahora se ha dicho, y en el año 2008 empezamos los trabajos de adaptación de la Quality of Life of Children with Epilepsy (QOLCE) que valora, como se ve por su nombre, Calidad de Vida en niños diagnosticados de epilepsia. En esta escala se dan los problemas habituales antes descritos: 1) muestras pequeñas para los estudios psicométricos, 2) escalas ordinales como criterio de respuesta, aunque algunos autores las suman y 3) ítems que no hay que completar simplemente porque no aplican, es decir, por que no es aplicable al sujeto que se quiere evaluar (por ejemplo, el niño no juega al fútbol simplemente porque no le gusta, no como limitación derivada de la enfermedad). Además, en esta escala se dan dos circunstancias que la hacen muy interesante, que la cumplimentan los padres del niño enfermo y que no hay demasiados estudios psicométricos (Gordovil, Villaseñor & Guardia, 2009).

Cómo superar toda esta serie de limitaciones es uno de los objetivos del trabajo general, aplicando técnicas de estimación estadísticas adaptadas y ajustadas a las posibilidades reales de los datos que se utilizan. Las estimaciones de origen y base bayesiana no son una novedad, de hecho las soluciones algebraicas a todo ello ya hace tiempo que se conocen y que se podrían utilizar. Pero, en nuestro ámbito, esto por ahora no ha sucedido. Son pocos los trabajos que se mezclan con un enfoque bayesiano de análisis y con un procedimiento más ajustado. Son diversas las razones que justifican esto, pero nos atrevemos a sugerir un par: 1) La mayor complejidad matemática de estos procedimientos que obligan a un conocimiento mucho más estricto de lo que implica hacer una comparación de medias con cualquier programa informático tipo SPSS y 2) El poco desarrollo de software amigable para hacer accesible este enfoque, aunque parece que últimamente propuestas como Tetrad, WinBUGS, R o similares pueden ayudar.

Los trabajos realizados hasta ahora van en la línea de combinar, pues, las estimaciones bayesianas con modelos estadísticos multivariantes que permitan analizar datos con mucho más sentido los primeros resultados asociados a la ya citada escala y a la necesidad de responder a demandas específicas de los datos de tipo aplicado. Por ello, los planteamientos generales del tema bayesiano que se pueden encontrar en varios referentes (Guardia, De La Fuente & Lozano, 2008) han sido aplicados ahora a modelos de regresión logística para mantener variables categoriales con base métrica y muestras no especialmente grandes, hemos estudiado las posibilidades de uso de este enfoque, como adaptar sus algoritmos, como ajustar sus indicadores valorando la bondad de todo este enfoque. Los resultados de las primeras simulaciones sobre este asunto se pueden encontrar en Gordovil, Guàrdia, Peró & De La Fuente (2010) y en estos momentos ya se dispone de las siguientes fases de estudio que fueron presentadas en el último "International Congress of Methodology" del año 2010 en Berlín y que se acabarán de presentar en el próximo congreso de Metodología de las Ciencias Sociales y de la Salud del próximo julio, al margen de un artículo actualmente en fase de revisión. Esperamos que la tesis doctoral derivada de estos trabajos se pueda presentar a final de este año con el desarrollo de diversas rutinas de simulación y de aplicación específica al estudio de la QOLCE de la que disponemos actualmente de la muestra probablemente más grande que se haya analizado estadísticamente.

Del Grupo sobre Técnicas Estadísticas Avanzadas Aplicadas a la Psicología (GTEAAP)

Mayo 2011

GORDOVIL, A.; GUÀRDIA, J. PERO, M. & DE LA FUENTE, E.I. (2010). Classical and Bayesian Estimation in the Logistic Regression Model Applied to Diagnosis of Child Attention Deficit Hyperactivity Disaorder. Psychological Reports, 106, 2, 519-533.

GORDÓVIL, A., VILLASEÑOR, T. & GUÀRDIA, J. (2009). Evaluación Cuantitativa de Calidad de Vida en Epilepsia Infantil y Adolescente. Estado del Arte. Revista Mexicana de Neuropsicología, Vol. 4 (1), 11- 15.

GUÀRDIA, J., DE LA FUENTE, E.I. y LOZANO, L.M. (2008). Bayesian inference for binomial populations. Bayesian estimation of children’s depression prevalence. Advances and Applications in Statistics, 9 (1). 13-35.