¿Seleccionar casos con base en la variable dependiente? ¡Sí!

El famoso -entre los politólogos- KKV (tal vez el libro más conocido sobre metodología en décadas recientes) sugirió por ahí de sus páginas 129-132 algo que versa así:  si alguien quiere poner a prueba sus hipótesis acerca de la relación entre X y Y, nunca debe seleccionar los casos con base en la variable dependiente. En sus palabras, los autores señalan que “la selección [de casos] debe permitir la posibilidad de que haya algo de variación en la variable dependiente. Esto resulta tan obvio que pensaríamos que no es necesario mencionarlo. ¿Cómo podemos explicar la variación en la variable dependiente si esta no varía? Desafortunadamente, la literatura está llena de trabajos que cometen este error…; por ejemplo, investigaciones que tratan de explicar… el surgimiento de revoluciones con estudios acerca únicamente de revoluciones…”.

El consejo resulta demasiado importante. Pongamos de ejemplo a un grupo de médicos que quiere examinar si fumar causa cáncer de pulmón (ojo, la palabra “causa” está en negritas pues este grupo de personas quiere saber no sólo si las variables fumar y tener cáncer de pulmón están correlacionadas sino, más importante, saber si fumar precede y da origen a la aparición del cáncer de pulmón; o, haciendo uso de un contrafactual, los médicos quieren saber si en la ausencia de fumar un paciente con cáncer de pulmón no hubiese tenido esta enfermedad). Supongamos que este grupo de médicos, por razones de tiempo y esfuerzo, decide encuestar a los pacientes con cáncer de pulmón que se encuentran internados en el hospital ABCDE.  De los resultados de esta encuesta los médicos observan que 100% de los encuestados ha fumado por largos periodos de tiempo en el pasado. Los médicos concluyen que, sí, fumar causa cáncer de pulmón. ¿Qué podemos decir al respecto? ¿Qué problemas tiene este análisis? Un problema obvio (bueno, tal vez no tan obvio antes de que genialidades como Ronald A. Fisher pusieran en boga el diseño de experimentos) es la “auto-selección” de los encuestados: puede ser que todos los encuestados con cáncer de pulmón tengan algún tipo de gen que los predispone a fumar y a tener cáncer de pulmón; o puede ser que los encuestados en el hospital ABCDE viven en una ciudad donde -por cultura o tradición- es común fumar y al mismo tiempo -tal vez por el ambiente de la zona en donde viven- es común tener cáncer de pulmón. En fin, existen un buen número de problemas que nos impediría concluir que el fumar causa cáncer de pulmón.

El consejo que daría algún metodólogo de las artes del análisis cuantitativo al grupo de médicos sería hacer un muestreo aleatorio (o algún otro tipo de muestreo representativo de toda la población -e.g. muestreo estratificado). Un muestreo de este tipo eliminaría cualquier variación sistemática tanto en el grupo de control como en el grupo de tratamiento. Todo muy bien… bueno, no tanto.

Una diversidad de autores en ramas de la ciencia política como “Política Comparada” o “Relaciones Internacionales” presentan hipótesis que sugieren relaciones causales en donde la variable independiente (o conjunto de variables independientes, por lo general llamadas INUS) es clasificada como condición “necesaria” para la aparición/surgimiento de la variable dependiente. Pongamos de ejemplo una hipótesis propuesta por Sidney Tarrow:

“en este estudio, voy a argumentar que las personas salen a las calles y protestan en respuesta a fuertes agravios y [a la presencia de diversas] oportunidades. Pero esto produce un ciclo de protesta sólo cuando existen profundos clivajes estructurales y estos son visibles, y cuando las oportunidades para protestar se abren en el sistema político… Pero, por sí solo, [este] cambio estructural sólo crea el potencial para el surgimiento de movimientos [sociales]…” (citado en Gary Goertz, “The Substantive Importance of Necessary Condition Hypotheses”, p. 72 -este artículo se encuentra en un librito llamado Necessary Conditions. Theory, Methdology and Applications -editado en 2003).

Tarrow ofrece una condición necesaria para el surgimiento de movimientos sociales (i.e. clivajes profundos y viables y la existencia de oportunidades en el sistema político). Ahora bien. ¿Le convendría a Tarrow llevar a cabo un muestreo aleatorio de casos, como bien recomiendan nuestros amigos KKV? No:

  1. El universo de casos donde hay movimientos sociales es mucho menor al universo de casos sin movimientos sociales. ¿En una década, por ejemplo, cuántas veces podrían surgir movimientos sociales en términos de días o meses? ¿En cuántos países? Seleccionar casos aleatoriamente obviamente podría excluir muchos de estos casos (esto se podría resolver, tal vez, con algún ponderador o con algún muestreo especial).
  2. ¿Qué beneficio traería para Tarrow seleccionar casos que no presentan ni la variable independiente (i.e. ni clivajes ni oportunidades) ni la variable dependiente (i.e. movimiento social)?
  3. ¿Qué utilidad tendría para Tarrow seleccionar casos que sí presentan la variable independiente pero no la variable dependiente? Las condiciones necesarias no obligan a la aparición de la variable dependiente, únicamente  la catalizan, la permiten o, en palabras de Tarrow, la “potencian”.
  4. Por último, y más importante, si la variable independiente  propuesta es una condición necesaria eso implica que la variable dependiente debe ser -si la hipótesis es cierta- un subconjunto de la primera. Es decir, Y \subseteq X . De ser este el caso, lo que el investigador estaría obligado a hacer  es seleccionar todos los casos en los cuales esté presente la variable dependiente y buscar si alguno de ellos no cuenta con la condición necesaria hipotetizada (sin embargo, contra este argumento, véase este artículo de Jason Seawright  -bueno, bueno… también véanse todas las contraréplicas a Jason en ese mismo número que apoyan lo que digo en este punto). Volviendo al caso de Tarrow, este autor,  contra KKV, debería únicamente seleccionar casos con movimientos sociales y buscar si todos ellos tienen (o no) clivajes profundos y oportunidades en el sistema político.

En fin, si el objetivo es poner a prueba una hipótesis que presente una condición necesaria, el consejo sería seleccionar siempre aquellos casos que cuenten con la variable dependiente (sea esta revoluciones, movimientos sociales, guerras, etc.).

Nota: Muchas de las ideas de este post vienen de autores como James Mahoney (un buenazo en los métodos cualitativos), David Collier y Gary Goertz.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: