30 agosto 2012

Encuestadoras Venezolanas, sus records y la Elección del 2012 - Actualización de Agosto


Este análisis, originalmente escrito en inglés como contribución al blog “Venezuelan Politics and Human Rights” lo traduzco, con ciertas modificaciones, en esta entrada del blog. (El artículo original se encuentra aquí). 

Faltando un poco más de un mes para las próximas elecciones presidenciales en Venezuela las encuestas siguen sin reflejar claramente el escenario electoral. Durante este último mes ha sido publicado un nuevo grupo de encuestas con resultados en el rango de 20 puntos a favor del Presidente Chávez hasta 2 puntos a favor de Henrique Capriles Radonski. Dada esta divergencia sigue siendo útil el ejercicio presentado el mes pasado (ver aquí). En esta oportunidad utilizaré entonces las correcciones definidas en la oportunidad anterior y las aplicaré a la última encuesta disponible de cada encuestadora para ver la evolución del panorama.

Recapitulando

Primero, hagamos un breve repaso al post anterior. En esa oportunidad argumenté que las encuestadoras tienden a errar, típicamente, en una dirección específica (a favor del gobierno o de la oposición), esto permite determinar unas medidas de sesgo con las cuales corregir las actuales predicciones. Segundo, en esa oportunidad resalté la existencia de dos escenarios basados en la historia electoral reciente de Venezuela: 1) un escenario en el que las encuestas dan a la oposición por delante, pero en los que el gobierno gana (2004 y 2009); 2) un escenario en donde el gobierno va por delante pero la oposición gana o llega muy cerca de hacerlo (como en 2007 y 2010). Estos dos escenarios sirven como base de dos medidas de “corrección” para las encuestas actuales. Una tercera medida de corrección se basa en el promedio de todos los errores para las elecciones anteriores. Estos términos de corrección se pueden apreciar en la Tabla 1.

 Tabla 1.  Sesgos por encuestadoras y proceso electoral


A propósito de unos comentarios muy útiles que he recibido quisiera explicar brevemente porque escogí el promedio de todas las encuestas pre-electorales para crear mi término de corrección, en vez de usar la última encuesta.

Varios comentarios recibidos me sugerían que al promediar todas las encuestas de cada encuestador dentro de un ciclo electoral, sin importar cuando fue realizada la encuesta, estoy penalizando a las encuestadoras “buenas” que predijeron correctamente una evolución cambiante en el transcurso del ciclo electoral (por ejemplo en el referéndum del 2004 la oposición estaba por delante en Junio pero el gobierno la pasó en los dos últimos meses. Esta preocupación es válida. Sin embargo, podemos ponerlo gráficamente y ver la figura 1. Aquí se puede observar las diferentes predicciones realizadas por cada encuestadora para la elección parlamentaria de 2010. También se puede ver una línea horizontal que demarca el porcentaje real de votos obtenidos por el gobierno (rojo) y la oposición (azul), la elección estuvo tan cerrada que las líneas parecen una sola.

Figure 1. Evolución a través del tiempo  de la intención de voto de diferentes encuestadoras par alas elecciones parlamentarias de 2010 


El problema entonces está en que al no existir una medida valida de opinión pública “real” en ningún punto antes de la elección no existe ninguna forma confiable de evaluar ninguna encuesta. Además, existe un problema intrínseco con solo usar la última encuesta antes de la elección. Si solo usamos la última encuesta para estimar el sesgo podríamos errar y dar una evaluación positiva a encuestadoras malas. Digamos que existen dos encuestadoras - una que consistentemente favorece al gobierno y otra que consistentemente favorece a la oposición. A medida que avanza la campaña dan encuestas muy diferentes pero al final las dos llegan al resultado “correcto”. ¿Significa esto que sus encuestas no estaban sesgadas? Claro que no.

Así pues esto termina siendo una decisión analítica de: a quien penalizar y a quien premiar. Si utilizamos el promedio –como hago yo- penalizamos a las encuestadoras buenas; si utilizamos la última encuesta premiamos a las malas. Yo prefiero penalizar a las encuestadoras buenas antes que premiar a las malas porque me parece el mejor de dos males. Además, en esta etapa de la elección, la preocupación de la gente es sobre la veracidad y validez de las encuestas actuales y no de las que saldrán justo antes de la elección.

La elección del 2012 – Actualización de Agosto

Desde mi ultimo análisis al final de Julio, varias encuestas nuevas se han hecho publicas; la mayoría de ellas con campo entre finales de Julio y principios de Agosto. La única encuestadora de la cual no tengo ninguna encuesta nueva es Keller; por lo tanto no será incluida en este análisis (esta exclusión no afecta los resultados del análisis). La tabla 2 muestra las predicciones con las fechas de cada encuesta y las tres correcciones mencionadas anteriormente: la corrección del escenario 2009 donde la oposición estuvo por debajo de su predicción; la corrección 2010 donde el gobierno estuvo por debajo de su predicción; y la corrección promedio.

Como se puede ver en el escenario 2010, el mas competitivo - y yo creo el mas realista – ninguna encuestadora tiene a Chávez por encima del 50% (después de la corrección); la que da mas intención de voto es Varianzas con 49%. Con respecto a la oposición, la única encuestadora que da a Capriles una predicción corregida de menos de 30% es Hinterlaces, el resto al contrario dan una intención de voto a Capriles en el rango de 35 a 44.

Tabla 2.  Ultima predicción disponible, por encuestadora, para la elección del 2012 y corrección masada en dinámicas electorales alternativas



Finalmente, cuando vemos estas encuestas corregidas juntas (tomando el promedio del escenario 2010) y las comparamos con los resultados del  grupo de encuestas anteriores obtenemos la figura 2. Aquí hay varias cosas importantes que resaltar:
1)      Chávez se mantiene debajo del 50%. Su promedio, aunque baja un poco se mantiene estable. En esta oportunidad, sin embargo, pareciera que el rango de sus valores se encogió lo que significa que las diferentes encuestadoras están de alguna forma llegando a un consenso en la ubicación numérica de Chávez.
2)      Los números de Capriles han aumentado de 34 a 37. Considerando que Chávez esta en 46 esto ubica la diferencia entre ambos en 9 puntos porcentuales. Sin embargo, a diferencia de los números de Chávez el rango de certeza de alrededor del promedio de Capriles aumento, lo que significa que hay poco consenso entre los encuestadores de la ubicación real de Capriles. 

Figura 2. Promedio de rango de las predicciones corregidas (escenario 2010) par alas encuestas de Julio y Agosto.


Como van las cosas puedo decir que la elección se esta haciendo mas cerrada. En muchos países una diferencia de 10 puntos se consideraría una victoria segura del candidato a la relección. Sin embargo, hay varios factores que hacen que Venezuela sea diferente. Primero, existe un número muy grande de electores indecisos (como un 20%) Su decisión de votar o no puede tener un impacto significativo, especialmente en el escenario de que se decanten masivamente por una alternativa. Segundo, Capriles ha venido aumentando su intención de voto consistentemente, inclusive en encuestadoras pro-gobierno, mientras Chávez permanece estático. Si esta tendencia continua, entonces Capriles estará en posición de cerrar la diferencia que existe entre ambos.

Además de todo esto, la explosión en la refinería de Amuay en la que murieron al menos 39 personas podría impactar la elección. Esto es el equivalente a lo que se denomina en política estadounidense una “Sorpresa de Octubre” (porque es un mes antes de las elecciones en Noviembre, algo de último minuto que altera la elección). Un buen manejo de la crisis por parte del gobierno puede mejorar la posición de Chávez en las encuestas, mientras que una mala gestión puede terminar de convencer a los indecisos a votar en su contra.  Similarmente, una politización extrema de esta por parte de la oposición puede impactar negativamente a Capriles ya que podría recordarle a los indecisos a la oposición pre-2006. 

----------------

Un último punto es que estos resultados son consistentes con el último análisis de combinación de encuestas que publiqué el día de ayer (ver aquí).

29 agosto 2012

Combinando las Encuestas - Entrega 6

Faltando un poco más de un mes para las elecciones y luego de tres meses sin hacer este  análisis (la ultima vez fue en Mayo) presento hoy nuevamente la combinación de todas las encuestas en busca de el verdadero escenario actual. Este ejercicio me parece particularmente interesante por dos razones:

1)     No es un promedio simple ya que toma en consideración las fechas de las encuestas, el tamaño de la muestra y la casa encuestadora
2)     Además de generar una estimación del punto en el que va la elección genera intervalos de confianza para saber que tan diferentes son las dos líneas de intención de voto
3)     Finalmente, y mas interesante aun genera una medida de sesgo de las casas encuestadoras.

Veamos entonces los resultados con todas las 91 encuestas que he logrado recolectar.

Lo primero que es importante ver es que desde el inicio de la campaña se cerró la brecha que había entre Chavez y Capriles. Si las dos sombras grises se tocan significa que la diferencia entre las líneas no es estadísticamente diferente de cero.

Y lo segundo, del 54-46 de Mayo, ahora pasamos a 53-47. O sea de 8 pasamos a 6 puntos porcentuales de diferencia,  1 mas que el margen de error común de la mayoría de las encuestadoras.



Con respecto a los sesgos de las diferentes casas encuestadoras se rompe por primera vez el control que sobre el valor real tenían Datanalisis, Hinterlaces y Varianzas. Según las 5 entregas anteriores estas encuestadoras eran las únicas cuyas mediciones no tenían sesgo. Pues eso cambio ahora la zona sin sesgo es exclusiva de Varianzas –y no por mucho-.


Más tarde esta semana volveré a repetir el análisis de los records de las encuestadoras y como eso afecta las predicciones actuales y veremos que tan cercanos dan los dos análisis.

24 agosto 2012

Make-A-Wish

Les quito un momento a los asiduos -o nuevos- lectores de este blog para pedirles su contribución a una causa muy importante. 

Estoy recolectando fondos para la fundación Make-A-Wish que le cumple deseos a niños en enfermedad terminal. Mi contribución es la de caminar 100km en 24 horas a nombre de esta fundación.

Si desean colaborar con esta causa pueden hacer su donación aquí

Muchas gracias!

Cómo van las cosas?

Hace un mes puse un gráfico que mostraba la evolución de las encuestas desde el 2010 (ver aquí). Ese gráfico esta en constante actualización a medida que se hacen públicos los diferentes estudios de opinión. 

Hoy decidí, gracias a ya varias sugerencias, cortar el gráfico desde el momento en el que se sabe quién es el candidato de la oposición. Es decir sólo incluyo aquellas encuestas hechas después de las primarias.

El resultado es este:

Nota: Si no ves el gráfico debe ser porque estás usando Internet Explorer.

23 agosto 2012

No todas las encuestas son iguales

Esta semana colaboré con el portal Venezuela Elige tratando de entender el porqué de las diferencias entre las encuestas.

Si quieres leerlo ve aquí.

10 agosto 2012

Dime con quien andas y te dire quien eres...


Hoy decidí hacer un pequeño análisis que muestre mes a mes donde ubica cada encuestadora la intención de voto por Chávez y por Capriles. Les presento entonces una serie de gráficos que presentan en el eje vertical a Chávez y en el eje horizontal a Capriles. Hay en cada gráfico una línea horizontal en 50% y una línea vertical en 40%. Son dos números aleatorios que escogí porque me parece que ayudan a visualizar cuatro grupos de encuestadoras. Los grupos son:
  1. Las encuestadora que dan más de 50% a Chávez y menos de 40% a Capriles (arriba a la izquierda).
  2. Las encuestadoras que dan más de 50% a Chávez y más de 40% a Capriles (arriba a la derecha).
  3. Las encuestadoras que dan menos de 50% a Chávez y menos de 40% a Capriles (abajo a la izquierda).
  4. Las encuestadoras que dan menos de 50% a Chávez y más de 40% a Capriles (abajo a la derecha).

Como se puede observar las distintas encuestadoras son bastante consistentes en donde ubican a la intención de voto a los candidatos y por eso al final les dejo un ultimo grafico que promedia las distintas encuestas de cada encuestadora.