“Big data y experimentos masivos para la síntesis de información en tiempo real sobre el impacto de covid-19 y las medidas para su contención en la población” es el título de uno de los 64 proyectos que financiará la Agencia Nacional de Promoción de la Investigación, el Desarrollo Tecnológico y la Innovación (Agencia I+D+i). A partir de la convocatoria, el objetivo de la agencia es “mejorar la capacidad nacional de respuesta a la pandemia, ya sea a través del diagnóstico, el control, la prevención, el tratamiento, el monitoreo y/u otros aspectos relacionados con covid-19”. De aquí que el plan de trabajo presentado por Enzo Tagliazucchi --doctor en Física e investigador del Conicet-- haya sido uno de los seleccionados. Junto a expertos del Instituto de Física de Buenos Aires, el Instituto de Ciencias de la Computación (FCEN-UBA), la Universidad Torcuato Di Tella y el colectivo de divulgación El Gato y la Caja, diseñará una plataforma con información confiable a varios niveles. A través de experimentos masivos a partir de redes sociales, analizarán datos sobre la salud mental de la población, sus desplazamientos en cuarentena y el consumo de noticias en medios masivos. A continuación, narra los detalles al respecto.
--¿De qué va la propuesta que presentaron en relación a Big Data y a la realización de experimentos masivos?
--A partir de las herramientas de Big Data, intentaremos recabar información de lo que ocurre, al menos, con el 10% de la población argentina. Nos servirá para medir la temperatura respecto de lo que va pasando en tiempos de excepción como los que vivimos. Luego, sabemos bien que siempre habrá excepciones que no estaremos en condiciones de cubrir; el país engloba demasiadas heterogeneidades como para pretender incorporarlas a todas. Cuando comenzó la pandemia nos comunicamos de manera virtual con los chicos de El Gato y la Caja, Mariano Sigman, Facundo Carrillo y varias personas más de las áreas de computación y de física de la UBA y Di Tella. Advertíamos que había un montón de virólogos, epidemiólogos y médicos que realizaban su contribución con mucha calidad pero faltaba algo.
--¿Qué faltaba?
--Somos gente que, habitualmente, trabaja con datos y nos interesa saber, en principio, qué ocurría en términos de salud mental y cuáles eran los comportamientos cognitivos de la ciudadanía a partir del coronavirus y las restricciones de aislamiento impuestas. Se nos ocurrió que era una buena oportunidad para iniciar experimentos masivos con el propósito de recopilar datos útiles y ubicarlos en un sitio de información centralizada para que estén al alcance de todo el mundo. De modo que, además de los experimentos que estamos en condiciones de hacer, también cruzaremos nuestros resultados con otros datos ya disponibles. Me refiero, por ejemplo, al número de infectados y de muertes, a la tasa de reproducción de la epidemia en función del tiempo. Información que anda desperdigada por la red y que es abordada de manera individual por los diferentes especialistas. Existen esfuerzos muy buenos, como el de Jorge Aliaga y el de Rodrigo Quiroga, pero están aislados. Lo que una sola persona pueda hacer siempre queda corto en relación a la tarea que puede emprender todo un equipo de desarrolladores. En muchos países del mundo ya existen plataformas donde el usuario accede a datos confiables y presentados de manera prolija con una visualización clara.
--¿La idea sería armar un repositorio de información sobre covid-19?
--Es más que eso. Sería un espacio en el que la gente pueda acceder a información que esté representada de una manera que sea amable, comprensible. Apuntamos a manejar distintas capas de datos: una más básica acerca de aquello que ya está disponible al público (las curvas de infectados, la tasa de reproducción), sumada a otras más complejas que dependerán de los experimentos masivos que nosotros hagamos. Sería óptimo tener un mapa del país y que cualquier usuario que haga clic en alguna región determinada pueda conocer el número de casos pero también otras variables: el modo en que el encierro afecta a la salud mental, o bien, cómo las noticias influyen en los usuarios de la gente de la zona. Queremos medir cuántas notas se consumen, qué referentes son los más citados, qué características tiene la agenda mediática a medida que avanza el tiempo. En nuestro equipo contamos con expertos que abordan muy bien el relevamiento de datos a partir de Twitter por ejemplo.
--¿Qué información pueden extraer a partir de Twitter?
--Un estimativo respecto de la hora en que se está despertando o se está yendo a dormir la gente. A partir de aquí podríamos acceder a algunas pistas respecto de una posible alteración en los patrones de sueño-vigilia, como producto del confinamiento. Otro de los proyectos que fue adjudicado, como el de Diego Golombek, irá en aquella dirección, con lo cual podremos complementarnos perfectamente. El Gato y la Caja, a través de su portal, ya ha difundido varios cuestionarios que ayudan a medir aspectos como la ansiedad, el bienestar y la resiliencia de la población. Ya han sido completados por más de 10 mil personas que los siguen a diario y que consumen las producciones que ofrecen. La pregunta es si somos capaces de, en base a los resultados que hallemos respecto de esta muestra reducida, ampliarlo hacia un número mucho mayor. Twitter y otras redes sociales funcionan como escenarios muy prometedores para cruzar data y arribar a conclusiones provisorias aunque importantes. Entender, en definitiva, cómo el aislamiento afecta la salud mental y física de las personas.
--¿De qué manera el uso de una red social puede arrojar conclusiones acerca del modo en que el encierro afecta la salud mental de las personas?
--Hay una distancia entre uno y otro punto pero las redes sociales, como mínimo, nos permiten saber de qué están hablando las personas. De qué se quejan, por qué motivo se sienten afectadas, cómo se modificaron sus rutinas. También relevaremos en un grupo de gente cómo se han transformado sus desplazamientos, es decir, de qué manera acatan la disposición gubernamental que los invita a no salir de sus casas. Medir cuántas veces salen y en qué nivel respetan la medida. Lo bueno de internet, otra vez, es que contamos con información geolocalizada. Mapearemos las zonas y decodificaremos lo que está ocurriendo con cada lugar en particular. Grandata es una empresa argentina que realiza aportes muy buenos y nos compartió algunos. Ellos examinan, en relación a datos anonimizados del celular, la relación entre el número de casos de contagios y los desplazamientos en zonas puntuales. Cada vez que un usuario emplea una aplicación se releva su latitud y longitud, y ello queda registrado. No es lo mismo lo que puede ocurrir en CABA respecto de lo que sucede en otras provincias con nula propagación de coronavirus.
--Es una estrategia que funciona a muchos niveles: salud mental, impacto mediático, movilidad ciudadana. ¿Podrán con todo?
--Nos parecía que lo que faltaba era poder cruzar información importante de manera razonable y luego presentarla de una forma accesible. Hay observatorios en el mundo que aprovechan la información en redes sociales y mediante las herramientas del Big Data extraen el máximo provecho posible. El subsidio es muy útil porque nos permite contratar a terceros que son especialistas en el diseño de este tipo de páginas y de visualizaciones, mientras que nosotros nos encargamos de aportar los datos. Crearemos una plataforma online que sea intuitiva, fácil de usar y esperamos que se transforme en una referencia. Habilitaremos la descarga de gráficos para que aquellos que quieran ahondar más en el análisis puedan hacerlo. Queremos que la información esté disponible para los expertos de la salud y puedan utilizarla para tomar las mejores decisiones. Nuestro proyecto es bueno porque le permite a la gente que sabe hacer aquello que sabe.