02 octubre 2012

Evolucion de las encuestas: La recta final!

Ya en la última semana de la campaña aprovecho para recordar que ha venido diciendo cada encuestadora sobre las elecciones. Hay algunas cosas interesantes como por ejemplo:

1) Consultores 21: en vez de abrir la brecha (pro-Capriles) en la última entrega esta se vuelve a cerrar.

2) GisXXI: El crecimiento de Capriles es obvio.




Para ser justos ya que yo he dado números basados en los análisis que resultan de combinar las encuestas en sus 8 entregas pongo entonces como ha venido esa evolución también.


15 comentarios:

  1. Just posted a link in CC... great news.

    ResponderEliminar
  2. Me llama mucho la atención y me hace desconfiar la aceleración de la subide de HCR y la bajada de HCF en muy pocos días, según se ve en el 2º gráfico. Me genera desconfianza y miedo opor exceso de optimismo. ¿Algún comentario al respecto?

    ResponderEliminar
    Respuestas
    1. La verdad no es mucho el cambio y tiene que ver con la forma en la que el programa hace las estimaciones. Cada vez que se agregan datos el regenera toda la secuencia, yo solo puse en este grafico los puntos en los que yo corri el analisis y los numeros que dio entonces. Ademas entre los dos ultimos puntos hay como 7 encuestas nuevas en los datos. Igual el intervalo de confianza (gris) muestra que hay empate - lo mismo que he dicho de hace rato!

      Saludos

      Eliminar
  3. Como se ha visto historicamente la variabilidad se ha reducido. GISXXI se comporta como de costumbre. Creo que todo esto es una buena senhal.

    ResponderEliminar
    Respuestas
    1. Si, el salto del GISXXI -me van a disculpar- es un poco ridiculo.

      Saludos

      Eliminar
  4. Lo pongo aca para regresar el Domingo luego de los resultados. Chavez gana con 12% de ventaja +/- 2% . Todo lo demás es ganas de soñar.

    ResponderEliminar
    Respuestas
    1. Y si es asi, yo hare un analisis diciendo quien se equivoco y aceptare que el modelo que corri estaba errado. Sin embargo, mi punto a lo largo de todo esto -y la idea del analisis- es tratar de informar y mostrar que las encuestadoras no estan diciendo la verdad.

      Eliminar
    2. Esperare ansioso el análisis entonces. Para darte algo de "food for thought" te menciono tres aparentes fallos graves de tu modelo:

      1) Asumes que las encuentas tienen sesgos históricos (lo que puede ser cierto en casos puntuales como GSXXI o las de la opo que dan empate técnico). El problema es que tu propia data lo contradice, casi todas han alternado el signo del sesgo, lo que indica poco bias y estar cerca de un forecast 50/50, como debe ser. Incluso tomando en cuenta solo las del 2006 y 2010, la mitad cambia el sesgo y la mitad se mantiene, justo lo que esperarias de un cambio aleatorio. Es decir, primera premisa errada.

      2) El segundo error, es creer que la incidencia de los NS/NC, indecisos, a esta altura de la elección va a ser relevante. Al contrario, ese 10% promedio de abstencion es muy optimista. Muy probablemente sea mayor. y esos 8-10% de diferencia se van a convertir en 12-14% en los resultados finales.

      3) El tercer error , relacionado con el anterior, es asumir que las preferencias por candidatos son variables independientes. A esta altura, el numero de personas que no van a participar está casi fijo y la gente tiene decidida su intención, a menos que mañana se descubra que Chavez es extraterrestre o que Capriles es Ateo. Esto quiere decir que las barras de error son de la misma magnitud para ambos candidatos. No puedes asumir que el porcentaje de indecisos (de nuevo como minimo 10%) se va a decantar por el candidato que tiene mas rango en sus datos, eso es una hipotesis ad-hoc no comprobada. Para ponerte un caso extremo, supon que los indecisos promedian 50%, el candidato A tiene 25%, 25% y 30% en tres encuestas y B tiene, 15%, 15% y 40%.El promedio de A seria 26.6 y tanto y el de B 23.3. Si yo se (muy cerca de las elecciones) que el 50% esta fijo, cualquier incertidumbre de un candidato, tiene su espejo en signo inverso en el otro. Asi que asumir que B tiene mas chance de ganar por alcanzar un rango mas alto es absurdo. De nuevo, aca la clave es que asumes que los indecisos quedan fijos, lo que para los numero que muestras (alrededor de 10%) es perfectamente razonable. Pensar de otra forma es creer en una abstencion de menos de 10%.

      Esto sin contar otras cosas, como falta de alguna prueba estadistica para descartar encuestadoras poco confiables (empate técnico? en serio?), metodologia poco clara, presentación escueta de la data me indica que tu intención es darle un aire de esperanza a la candidatura de Capriles mas que analizar objevitamente la data.

      Y tranquilo, que luego esperare el analisis del fraude, aun tengo en mis archivos este artirculo fundacional de la estadistica:

      http://projecteuclid.org/DPubS?service=UI&version=1.0&verb=Display&handle=euclid.ss/1330437935

      La última vez que vi tenia mas de 15000 citas ;)

      Eliminar
    3. Hola, gracias por tus comentarios. Primero que nada, disculpa la brevedad de mis escritos. Esto se debe a que los hago en mi tiempo libre que es bastante limitado. Por lo tanto trato de no repetirme una y otra vez. El analisis combinatorio por ejemplo tiene 8 entregas ya, en la primera mencione el modelo y puse la referencia al articulo academico de donde proviene.

      Sobre tus comentarios no estoy seguro muy bien a que te refieres pues pareciera que hablan de otros posts y no de este. En este solo estoy presentando los numeros de las encuestadoras mas nada. No hay correcciones, ni sesgos, ni nada. El grafico 2 (el del modelo que corro) tampoco incluye sesgos historicos. Si lees el paper que cito en la primera entrega podras ver de que va la cosa. Basicamente es un modelo estadistico que se corre con los datos que hay y hace estimaciones para cada dia en la serie, en base a eso establece que tan sesgadas son las diferentes encuestadoras.

      Tercero, no tengo ninguna agenda. Si hay algo que yo detesto es la gente cantando fraude. No se si has leido mis otros posts no relacionados con las encuestas pero yo soy el primero en criticar a la oposición. Que los números muestren a Capriles arriba o cerca no es mi culpa.

      Cuarto, a que encuestadoras quieres que quite? cuales son las encuestadoras poco confiables segun tu? yo incluyo a todas las que consigo salvo que sean obviamente falsas -como Datos Interdata-.

      Quinto, nunca me veras diciendo que hubo fraude. Salvo que existan pruebas, yo siempre he defendido los resultados del CNE y he criticado a los politicos y periodistas sin oficio que gritan fraude en lo que sus preferencias no son las que ganan.

      Saludos

      Eliminar
    4. Hola, excelente respuesta. Nobleza Obliga. Igual que tu, no tengo tanto tiempo ahorita, pero en lo que tenga oportunidad leo el paper y te comento, ademas de tus otras respuestas.

      Saludos Simoneros!

      Eliminar
    5. Saludos simoneros tambien a ti...me pregunto si nos conocimos en la simon.

      Eliminar
  5. I guess the thing that's driving this is - amazingly, the bias-adjusted GIS numbers. Bien jodidos tienen que estar para que Jesse le de a Chávez menos de 15 puntos...

    ResponderEliminar
  6. Estos numeros no son "bias adjusted" son los numeritos que ellos mismos dijeron...

    Saludos

    ResponderEliminar
  7. Hola amigo,

    Excelente trabajo el que haces. Lo que sí sería bueno es dar un poco más de explicación sobre los gráficos para que tú información sea difundida a muchas más personas.

    Saludos.

    ResponderEliminar