Logo de la Universidad de Buenos Aires

NOTICIAS

Imagen ilustrativa UBAHOY
| INVESTIGACIÓN

La Inteligencia Artificial al rescate de las encuestadoras

Un algoritmo, desarrollado por investigadores UBA, puede medir el apoyo a los candidatos políticos durante las campañas leyendo millones de discusiones políticas en Twitter, en tiempo real.

Imagen de la noticia La Inteligencia Artificial al rescate de las encuestadoras

Conocer las fluctuantes decisiones de los votantes sería la gallina de los huevos de oro de cualquier encuestador político, un área que ha perdido la confianza de la gente en la última década. La mayoría de las consultoras políticas tuvieron mediciones muy alejadas del resultado real. ¿Por qué fallaron tanto?

Si queremos realmente comprender cómo oscilan las decisiones políticas de los 33.193.686 electores habilitados para 2019, tomar una muestra de unos pocos miles de personas, como hacen las encuestadoras, no alcanza en tiempos de incertidumbre.

Es humanamente imposible seguir los cambios de opinión de más de 33 millones de personas. Por eso, investigadores de la UBA fueron en busca de ayuda de la llamada Inteligencia Artificial. No se trata de un robot súper inteligente que puede responder a lo que queramos preguntarle, sino un programa de computadora capaz de extraer información a partir de lo que publican los usuarios de Twitter.

Analizando redes sociales

El comportamiento de la gente se puede estudiar desde muchas ópticas, en el Grupo de Redes Complejas y Comunicación de Datos de la Facultad de Ingeniería se plantearon estudiar cómo se comporta la gente desde una perspectiva un tanto diferente, que es la de la física de los sistemas complejos.

“Estamos estudiando las publicaciones en Twitter de usuarios con intereses en la política del país. En concreto, durante las elecciones presidenciales pasadas capturamos 54 millones de tweets a partir de los que analizamos la cohesión en el discurso de los seguidores de distintos candidatos. Luego comparamos la cohesión de cada uno de los grupos de seguidores y la similitud entre distintos grupos”, explicó José Ignacio Alvarez-Hamelin, investigador UBA-CONICET y director de CoNexDat, el Grupo de Redes Complejas y Comunicación de Datos.

“Un sistema complejo es aquél que resulta de la integración de numerosos elementos individuales -que aisladamente tienen ciertas propiedades- y que, por el hecho de asociarse generan un comportamiento que se denomina emergente. Este comportamiento global del sistema no se puede explicar a partir de las propiedades individuales, sino que surge de sus interrelaciones”.

El enfoque de sistemas complejos se utiliza para estudiar diferentes problemas, como por ejemplo el funcionamiento de Internet, la propagación de epidemias o las redes sociales. En este último caso, se puede ver que el comportamiento de cada persona o usuario es influenciado por amigos o conocidos.

Así es como el grupo CoNexDat de la Facultad de Ingeniería comenzó a estudiar las publicaciones de la gente en Twitter como fuente de datos. La información pública que postean los seguidores de los candidatos, accesible a todo el mundo.

Para ello se valen de una “máquina”, como llaman ellos al conjunto de algoritmos que se ocupa de captar los millones de twitts, leerlos, separarlos en grupos, compararlos, y analizarlos. Algo que a una persona podría llevarle décadas, esta “máquina” lo hace en minutos. Si bien para eso, los investigadores han debido entrenarla a través de técnicas de lo que se conoce como machine learning o aprendizaje de máquinas.

En una primera etapa, los investigadores entrenaron al algoritmo para descubrir los temas de discusión en Twitter, a través de los hashtags que se usan al hablar de política. Los hashtags son un recurso común con el que los usuarios de Twitter etiquetan sus discusiones.

De esta forma, descubrieron unos 4000 tópicos políticos, cada uno de ellos con cientos o miles de hashtags. A partir de esta información el algoritmo puede comparar los intereses y posturas de las personas. De esta forma los investigadores han podido entender la cohesión de los distintos grupos de usuarios, y como la misma ha fluctuado durante la campaña electoral anterior.

Discusiones políticas

En el estudio de 2015, los investigadores se enfocaron en analizar a los seguidores de los cuatro candidatos principales: Scioli, Macri, Massa y Stolbizer. En la primera vuelta, los que sacaron más votos fueron Scioli, con el 37,08%, seguido por Macri, con el 34,15% y no tan lejos Massa, con el 21,39 %. Stolbizer lejos con el 2,51%. Las encuestadoras fallaron en analizar cómo la gente estaba decidiendo, nunca acertaron lo que estaba sucediendo previo a la primera vuelta, ni tampoco en la segunda.

“Una cuestión interesante que descubrimos”, contó Alvarez-Hamelin, “fue que entre medio de la primera vuelta y el ballotage el discurso de los seguidores de Massa se empezó a asimilar al discurso de los seguidores de Macri”.

En la Segunda Vuelta de las elecciones de 2015 eso se vio reflejado en la diferencia que sacó Macri, 51,34 %, contra Scioli, 48,66 %.

“Nuestro objetivo no era estimar cantidades de electores de cada candidato, sino encontrar diferencias en el comportamiento colectivo de los grupos de seguidores”, explicó Mariano Beiró, parte del grupo CoNexDat, investigador UBA-CONICET y profesor de la Facultad de Ingeniería.

“Nuestro enfoque es distinto del tradicional dentro de las ciencias sociales”, continuó, “que se basan más en el uso de encuestas, o en la observación personalizada. A partir del aporte de la computación y de lo que se conoce como ciencia de datos, podemos aprovechar la disponibilidad de datos masivos que ofrecen las redes sociales, por ejemplo, para estudiar el comportamiento a gran escala de la población”.

“No se puede predecir el comportamiento de una persona, porque las personas no son máquinas”, afirmó Beiró, “pero cuando miramos a gran escala al sistema encontramos patrones o propiedades macroscópicas como las que podríamos encontrar en un sistema físico. Estas propiedades no pueden explicarse a nivel individual, pero a nivel colectivo pueden entenderse como emergentes de las interacciones entre los elementos individuales, y esto se ha encontrado también en la sociedad”.

“Este estudio a partir de datos de las elecciones del 2015 lo hemos hecho a posteriori. Para las próximas elecciones utilizaremos el algoritmo generado para analizar el comportamiento de los grupos de seguidores en tiempo real. De todas formas, al utilizar este tipo de fuentes de datos es necesario tener en cuenta los posibles sesgos existentes en el uso de determinada red o tecnología”, aclaró Beiró.