Al concluir la votación presidencial en México, el Programa de Resultados Electorales Preliminares (PREP) puso a disposición del público en general los datos parciales conforme eran procesados. Durante la noche de la elección hice un pequeño programa de cómputo para capturar dicha información cada cinco minutos (más el tiempo necesario para que el servidor me contestara). De las páginas capturadas es de donde extraje la información que presento abajo, aunque contienen mucha más información que podría ser de utilidad.
En la figura 1 se muestra a el porcentaje total de la votación logrado por Felipe Calderón y por Andrés Manuel López Obrador como función del porcentaje de actas procesadas. Empecé a capturar los datos pues me llamó la atención que cuando apenas se había computado el uno por ciento de las actas, Calderón iba arriba por alrededor de 7 por ciento y gradual, pero sistemáticamente, su porcentaje iba disminuyendo mientras el porcentaje de López Obrador iba aumentando. Yo hubiera esperado un resultado muy fluctuante que rápidamente se estabilizara alrededor de los valores finales hacia el final del conteo. Este resultado muestra que las primeras casillas contabilizadas tuvieron resultados aparentemente atípicos y que le dieron a Calderón una ventaja porcentual considerable que disminuyó conforme avanzaba el conteo. Desgraciadamente no pude capturar los datos desde el principio, pero el comportamiento de esta gráfica se puede extrapolar cualitativamente hasta el momento en que se habían computado el primer porciento de actas. La pregunta es ¿por qué el inicio de las actas computadas (quizás poco más de mil actas) tuvo un comportamiento tan aparentemente atípico?
Otra característica que me llamó la atención de esta figura es la ausencia de fluctuaciones, aunque creo que eso es normal.
Finalmente, es curioso que la tendencia al alza de López Obrador, que se había mantenido constante durante el 70 por ciento del conteo se revierte rápidamente al llegar al 70 por ciento más de las actas procesadas. Sin embargo, esto podría explicarse si fuera que el voto rural, quizás mayoritariamente pro Revolucionario Institucional (PRI), hubiera empezado a llegar y a computarse cerca de las dos de la madrugada. Otra posible explicación es la llegada de los resultados del noroeste, retrasada debido a las diferencias de uso horario.
Advertencia: la curva correspondiente a Roberto Madrazo fue modificada para poder mostrarla en la misma gráfica, añadiéndole 13 por ciento. Por lo tanto, el lector deberá restar 13 por ciento del valor que lea en el eje vertical. (Figura 1)
La figura 2 indica la velocidad de recepción y proceso de actas. El eje horizontal corresponde al número de accesos del programa, diseñado para tomar una fotografía de la página del PREP cada cinco minutos, aunque dada la saturación del sistema el tiempo de acceso osciló entre cinco y 10 minutos. El eje vertical muestra el porcentaje de actas procesadas. Claramente hubo una desaceleración notable en la velocidad de recepción y proceso, lo cual podría explicarse con el arribo tardío del voto rural. Cerca del dato 31 (correspondiente al acceso 42), alrededor de la una de la mañana hay un pequeño salto. Este se debe a que el PREP no actualizó su página en poco más de 20 minutos. A partir de ahí el ritmo de captura empieza a disminuir. Poco después los datos de López Obrador, en la figura de arriba, muestran un máximo e inician un descenso. Antes del pequeño salto el comportamiento es aproximadamente lineal, mientras que después decrece gradualmente. Una explicación tentativa es que al principio del conteo las actas arribaron a una velocidad mayor a la capacidad de proceso del PREP, por lo cual se formó una cola. Hasta la una de la madrugada el PREP estaría trabajando a su máxima capacidad, que podemos estimar como la pendiente de la región recta. De las páginas del PREP se infiere que de las nueve y media de la noche a la una de la madrugada se procesaron cerca de 70 mil actas, por lo que la capacidad de proceso del sistema es de aproximadamente 330 actas por minuto. Habiendo disminuido el ritmo de llegada de las actas, las actas se procesarían inmediatamente conforme fueran llegando y la velocidad del proceso aparente en la figura sería simplemente la velocidad de arribo. (Figura 2)
En la figura 3 se muestra el número total de votos obtenidos por los tres candidatos como función del número de actas procesadas. Curiosamente, Calderón y López Obrador incrementan su número de votos aproximadamente con la misma velocidad. Calderón y López Obrador recibieron aproximadamente el mismo número de votos por casilla computada. Es por ello que me pareció atípico que en las primeras casillas computadas (no mostradas) Calderón estableciera una fuerte diferencia que no se modificó prácticamente en las demás casillas. Esta gráfica indica que el acercamiento entre los porcentajes de la votación obtenidos por Calderón y por López Obrador disminuyó al transcurrir el tiempo, sobre todo por el aumento del número total de votos computados y no por que hubiera disminuido la diferencia de votos entre ellos. (Figura 3)
En esta figura muestro los votos obtenidos por Calderón y por López Obrador en cada casilla, promediados sobre todas las actas que se procesaron en los cinco a 10 minutos en que el programa obtenía una nueva radiografía del proceso. Esta gráfica muestra fluctuaciones aparentemente normales y resultados muy similares para ambos candidatos durante el tiempo que el programa estuvo capturando datos. Hacia el final, el número de votos disminuye y las fluctuaciones aumentan, pero podría ser consecuencia de la llegada de votos rurales, de comunidades aisladas, cada vez más espaciados en el tiempo, mientras que los tiempos de muestreo fueron uniformes. Hay, sin embargo, una anomalía curiosa alrededor de las 61 mil – 62 mil actas procesadas en que aparecen estructuras similares correlacionadas en las curvas correspondientes a los tres candidatos. Una anomalía que definitivamente requiere explicación corresponde a los datos hacia el final del conteo, donde se ven fluctuaciones tan grandes que se salen de la gráfica. En esta región se llegan a detectar más de mil 200 votos por casilla. Creo que ninguna casilla debía haber recibido más de 750 votos. Peor aún, algunos datos indican un número de votos por casilla negativos. Estudiando con detalle una de estas anomalías a través de las páginas del PREP, encontré que el número de actas procesadas a las 12:39 era de 127 mil 772, mientras que hora y media después, a las dos de la madrugada, el número disminuyó abruptamente, situándose en 127 mil 752, por debajo de su valor a las 12:39. Este es un error que sólo podría ser explicado por personal del PREP. (Figura 4)
Por último, esta figura muestra la diferencia entre los votos atribuidos a Calderón y a López Obrador como función del número de actas procesadas. La curva muestra claramente tres regiones: una subida seguida de una caída, otra subida y finalmente algunas fluctuaciones. Las primeras tres regiones muestran pendientes bastante constantes y las transiciones de una a otra son bastante abruptas. El origen de dichas transiciones debe ser explicado. Aún no hago un análisis de las fluctuaciones de estos datos para checar si son o no anómalos.(Figura 5)
En esta figura muestro los datos iniciales de la figura 3, correspondientes a las primeras 20 mil actas capturadas. Con una línea vertical he marcado desde donde tengo datos capturados sistemáticamente (con 10 mil 943 actas procesadas). De ahí a la derecha se muestran los datos capturados para los tres candidatos. Los tres candidatos muestran una tendencia lineal sin fluctuaciones aparentes, quizá por haberse acumulado ya un número grande de votos, del orden de un millón. Del lado izquierdo de la línea vertical muestro tres líneas rectas (no rotuladas) que parten del origen y terminan en el primer dato capturado para cada candidato. Extrapolé dichas líneas hacia el lado derecho de la gráfica para compararlas con los datos iniciales de los candidatos. En el caso de Calderón, los datos del PREP y la línea recta que parte del origen son prácticamente indistinguibles. En el caso de Madrazo hay una ligera diferencia, lo cual refleja que la votación por acta hacia Madrazo iba aumentando gradualmente, lo cual es consistente con la figura 4. Sin embargo, la línea recta correspondiente a López Obrador se aleja bastante más rápido de los datos obtenidos del PREP. Eso hace suponer que en las primeras 10 mil casillas la votación por Andrés Manuel fue significativamente menor que en las subsiguientes. La pendiente inicial correspondiente a la curva de López Obrador tuvo que ser notablemente menor que la pendiente subsiguiente, pues obviamente los datos deberían pasar por el origen. Es sin embargo interesante hacer una extrapolación de los datos de López Obrador. Empleando los datos del intervalo [10 mil : 20 mil] hice una extrapolación lineal. La ordenada al origen es -126 mil. Curiosamente, dicho número es muy cercano a (menos) el número total de casillas. La figura que le sigue (figura 7) es la misma que la figura 6 pero extendida hasta 70 mil actas. Curiosamente, el ajuste lineal realizado sólo con los datos de López Obrador entre 10 mil y 20 mil es prácticamente indistinguible de los resultados correspondientes del PREP sobre todo el rango.
En un escenario de mucha especulación sobre conspiraciones, estos datos podrían interpretarse de la siguiente manera: pareciera haberse restado un voto a favor de López Obrador por cada una de las 130 mil casillas durante la acumulación de los resultados. Seguramente, se podrían encontrar otras explicaciones. Será interesante saber por qué el voto de las primeras 10 mil casillas fue tan distinto al de las 60 mil casillas subsiguientes, el cual habíamos visto en la figura 5 que es muy distinto al de los que siguieron. Urge procesar los datos correspondientes a las primeras 10 mil casillas. (Figura 6 y 7)
Ahora que tenemos más datos podemos contestar algunas preguntas. Por ejemplo, la ventaja numérica inicial de Calderón sobre López Obrador en las primeras casillas computadas no fue tan grande como podría suponerse de su gran ventaja porcentual, sino que se fue construyendo gradualmente durante las primeras 70 mil casillas computadas. No hay que olvidar que un porcentaje se obtiene de hacer una división y puede resultar grande tanto si el numerador es grande como si el denominador es pequeño. Sin embargo, los nuevos datos originan nuevas dudas.
Los resultados arriban al PREP en un orden determinado principalmente por la accesibilidad y facilidades de comunicación. Así, los datos de ciudades grandes arribarían antes que los de ciudades pequeñas y éstas antes que de poblaciones rurales. Sin embargo, no esperaría otras distinciones geográficas ni de clase socioeconómica. Por lo tanto me queda abierta la pregunta ¿son normales y explicables los datos mostrados arriba? ¿Cuál es su explicación? ¿Son consistentes con resultados de elecciones previas?
Es importante resaltar que la elección se define por el valor final del recuento de votos y que el “ganador provisional” durante el recuento debería considerarse un dato circunstancial sin valor alguno. Si las mismas boletas fueran contadas en un orden distinto, podría fácilmente modificarse la identidad del “ganador provisional” durante parte, o incluso, durante la mayor parte del conteo. Sin embargo, su identidad sí tiene un valor psicológico y estratégico, pues fortalece la imagen entre la ciudadanía de que hay un ganador establecido desde el inicio del conteo. De hecho, desde la noche de la elección, el candidato del PAN argumentó que había estado por arriba de su contrincante durante todo el conteo, como si esa información sirviera para establecer su triunfo de manera irrebatible. Este argumento ha sido repetido en días posteriores en los medios. La implicación es, desde luego, falaz.
Publicado: Julio 2a quincena de 2006 | Año 4 | No. 60
|