South American Research Journal, 2(1), 27-35
https://www.sa-rj.net/index.php/sarj/article/view/12
ISSN 2806-5638
empleada es la API (Application Programming
Inference) de Twitter. Al respecto se han encontrado
algunos estudios. En España, se evaluó las elecciones
regionales y generales del 2011 obteniendo que el
volumen de tweets se correlaciona con los votos de los
electores por partidos políticos (Soler et al., 2012). El
estudio realizado en Italia también monitoreó el
volumen de los tweets relacionados con los distintos
partidos políticos y los resultados de las elecciones
& Hamling, 2017; Hadi et al., 2019), los resultados de
las elecciones generales del Reino Unido 2010
(Kalampokis et al., 2017); la elección presidencial de
Indonesia en el año 2014 (Ibrahim et al., 2015), así como
a las elecciones presidenciales francesas de 2017 (Wang
y Gan, 2017). Por otro lado, resultó muy novedoso
encontrar dos publicaciones que señalan haber realizado
una predicción previa a la publicación de resultados (ex
ante) en elecciones de la Cámara de Representantes de
Estados Unidos 2010 y 2012 (Huberty, 2015; Huberty,
2013) y la elección presidencial de Indonesia (Budiharto
y Meiliana, 2018). Existen otras propuestas que analizan
Facebook, así ocurrió en la propuesta de las elecciones
parlamentarias de la Unión Europea del 2014 (Braga
et al., 2017) o en las elecciones generales del Reino
Unido del 2015 (Burnap et al., 2016). Además, resulta
curioso el trabajo (ex ante) con métodos combinados de
encuestas y Twitter. Este fue el caso de Awais et al.
(2021) quien aplicó un modelo combinado para las
elecciones generales de Pakistán de 2018; así como el
caso de Callejas Cuervo y Vélez Guerrero (2019),
quienes predijeron las elecciones presidenciales de
Colombia en 2018 .
Finalmente, el análisis de sentimientos
supervisado que consiste en la aplicación del big data
con algoritmos supervisados por humanos y que ha sido
aplicada al menos en tres lugares diferentes empleando
las bases de la API de Twitter. Un primer caso fueron
las elecciones generales irlandesas de 2011
(Bermingham y Smeaton, 2011); luego se encuentra en
elecciones presidenciales de Estados Unidos del 2012
(Attarwala et al., 2017) y, en este mismo país, en las
elecciones presidenciales del 2016 (Ramteke et al.,
2016). Sin embargo, ninguna de estas propuestas tiene
una versión ex ante, pues todos los modelos fueron
aplicados después de las elecciones. Sólo el estudio de
Ceron et al. (2016b) empleó un algoritmo propio
denominado SASA (Supervised Aggregated Sentiment
Analysis) demostrando efectividad en la predicción de
las elecciones presidenciales de Francia, Italia y Estados
Unidos en el año 2012, con errores bajos. Por lo tanto,
se considera, hasta el momento uno de los modelos más
efectivos y más recurrentemente citados.
(
Caldarelli et al., 2014). En Alemania la mera cantidad
de mensajes que mencionan un partido reflejó el
resultado de las elecciones (Tumasjan et al., 2011).
Asimismo, el estudio de las elecciones del Congreso de
los EE. UU. Del 2010 y 2012 demostró que la cantidad
de tweets predice el número de votos (DiGrazia et al.,
2
013). El único estudio identificado en América Latina
con este método se realizó en Chile, el cual concluyó que
las veces que mencionan a los candidatos es un predictor
del voto electoral (Santander et al., 2017). Otra fuente
para la técnica computacional es Facebook, misma que
ha sido empleada para predecir la nominación
presidencial de 2008 en Estados Unidos obteniendo un
alto nivel predictivo (Williams y Gulati, 2009). Una
combinación poco usual es la que une bases de datos
obtenidas en encuestas y Facebook, así se hizo en un
estudio de las elecciones generales de Nueva Zelanda
(
Cameron et al., 2016). También se considera una
fuente para el big data a las publicaciones de la prensa,
sobre la cantidad de menciones que se hacen a partidos
o candidatos, este fue el caso del trabajo sobre las
elecciones presidenciales de Estados Unidos en el 2004
(
Lerman et al., 2008). Por su parte otra propuesta de esta
naturaleza se realizó en Italia para el referéndum
constitucional del 2016, las elecciones municipales de
Roma del 2016 y las elecciones generales de Italia del
2
018 (Fronzetti Colladon, 2020). Por último, un análisis
de las elecciones presidenciales de 2018 en Brasil
consideró a varias redes sociales combinadas con las
encuestas (Firmino
y Murta, 2019). Todas las
predicciones encontradas se realizaron después de
ocurrido el hecho electoral (ex post) por lo que la
predicción se orienta a la creación de modelos, antes que
a generar un mecanismo real de predicción.
Una segunda técnica que es más avanzada que la
primera constituye el análisis de sentimientos a través
del big data, empleando inteligencia artificial y
aprendizaje automático. Es decir, estos modelos
Cabe mencionar que un promedio a nivel general
obtenido de los estudios ha publicado el error cuadrado
medio (MAE) da como resultado un valor de 2,7%,
mientras que la predicción electoral en términos de
regresión es del 79,5%. Desde luego, este último
indicador no es un valor confiable pues en casos muy
específicos varían los tipos de regresión o correlación,
por lo tanto, no se trata de un valor confiable, sino de un
indicador aproximado pero limitado. Por su parte, el
MAE constituye un indicador en el que se puede confiar
mayormente pues casi todos los estudios emplean la
misma ecuación para obtenerlo. En cualquier caso, estos
porcentajes constituyen un referente limitado, pero
únicamente
son
analizados
por
algoritmos
computacionales. En efecto, esta propuesta es de las más
avanzadas y en ella se encuentra mayor cantidad de
publicaciones. Ejemplos del empleo de la API de
Twitter son los modelos predictivos (ex post) aplicados
a las elecciones al Congreso de los Estados Unidos del
2
010 (Livne et al., 2011; Metaxas et al., 2011);
elecciones de Singapur (Skoric et al., 2012); elecciones
presidenciales de Estados Unidos en el 2016 (Agrawal
https://doi.org/10.5281/zenodo.5908534
30