Logotipo del repositorio
 

¿Por qué en ocasiones los resultados de las encuestas de opinión se alejan de la realidad? Un análisis con escenarios en Python

Fecha

2021

Autores

Benavides, Francisco
Jiménez Oviedo, Byron

Título de la revista

ISSN de la revista

Título del volumen

Editor

Tecnológico de Costa Rica

Resumen

Antes de la segunda ronda de las elecciones presidenciales costarricenses del año 2018 en Costa Rica, se realizaron varias encuestas de opinión con el fin de evaluar las preferencias del electorado. Las encuestadoras en Costa Rica indicaban, en algunos casos, un empate técnico entre el candidato de Restauración Nacional y el del Partido Acción Ciudadana, y en otros casos una clara preferencia por el primero. El resultado final de las elecciones fue muy diferente al de estos estudios, y el triunfo del candidato del partido Acción Ciudadana fue claro y totalmente alejado de los márgenes de error asociados con la mayoría de los resultados obtenidos por las empresas encuestadoras. A raíz de esto, una pregunta natural surge: ¿por qué fallan las encuestas electorales? Uno de los argumentos utilizados es que las encuestas fueron realizadas con al menos una semana de antelación a las votaciones, y la opinión del electorado cambió en ese tiempo. En el presente trabajo se plantean situaciones hipotéticas de posibles escenarios en los que el sesgo de las encuestas se puede presentar, así como una metodología para su detección. Se analiza, en particular, la tasa de respuesta de los encuestados y su influencia en las estimaciones de la encuesta. El hecho es que si los que apoyan a un determinado partido tienen una tendencia generalizada de no responder una encuesta, entonces los resultados de ésta serán sesgados, sin importar el momento en que se hagan las entrevistas. En este trabajo, los escenarios sintéticos son simulados computacionalmente utilizando Python por su interés didáctico. También se simulan métodos de ponderación para compensar estas deficiencias. Este artículo pretende abrir un espacio didáctico de discusión de los aspectos técnicos, matemáticos y computacionales de las encuestas de opinión nacionales, así como producir un escenario sintético computacional que pueda derribar algunos mitos populares frecuentes, como el mito de que sólo mil personas encuestadas no son suficientes para obtener una representación significativa de la opinión del electorado.
Before the runoff election that took place in Costa Rica in 2018, several opinion public polls were executed in order to survey the electorate tendencies. The poll companies that made these surveys showed a technical draw between both candidates or, in other cases, a clear advantage for the “RestauraciónNacional” candidate over the “Acción Ciudadana” candidate. Opposed to this, the final election result gave the “Acción Ciudadana” candidate a clear win, with an advantage that was considerably larger than the error percentage that all polls estimated. Considering this, a natural question can be asked: why do polls fail? One of the answers provided by the poll’s companies was that they were not allowed to make surveys unit one week before the election, and the electorate opinion changes with time. In the present work we give a series of hypothetical scenarios in which polls may fails, and a methodology to detect these biased results. Particularly,we analyze the electorate’s polls answer rate and its influence in the polls estimates. In fact, if the supporters of a given candidate don’t want to answer a poll survey, the poll’s results will be biased, independently of the time in which it was made. In this work, we create these scenarios using Python and we also propose alternate weighing methods to compensate these biases. We pretend to open a discussion in poll’s results that take into account technical, mathematical and computer simulation aspects that are not generally taken into account in Costa Rican’s public opinion surveys and avoid myths such as the sample size is unable to predict the entire population preferences.

Descripción

Palabras clave

ESTADISTICA, ELECCIONES, STATISTICS, ELECTIONS, COSTA RICA, ENCUESTAS, PYTHON (LENGUAJE DE PROGRAMACIÓN)

Citación