› Por Adrián Paenza
¿Cuántos teléfonos celulares hay en la Argentina? La respuesta depende de la fuente que uno consulte. Algunos sostienen que hay más de 50 millones y otros un poco menos. No importa. A los efectos de lo que quiero proponerle pensar, lo más relevante es que hay decididamente más teléfonos celulares que personas que habitan el país.
Las compañías telefónicas que proveen el servicio de telefonía celular poseen una herramienta de un extraordinario poder: la base de datos que generan sus usuarios. Pero espere: no me refiero a los nombres de las personas que son dueños de los teléfonos. Ese sería un dato insignificante, equivalente a decir que tienen los nombres de una guía telefónica 1). No. Me refiero a otra cosa.
Cada vez que usted hace una llamada con uno de ellos, no sólo está usando su teléfono y el número que tiene asignado, sino que también necesita usar una antena (o más). En el momento en que se produce la llamada, la señal que usted envía llega a la “torre” más cercana que tiene su proveedor. Desde allí sigue entonces el proceso. Si usted se está moviendo, las antenas van cambiando a medida que usted va cambiando de locación, y esta operación es totalmente transparente para el usuario que no presta atención (ni razón hay para que lo haga) al despliegue tecnológico necesario para que la conexión ocurra y se mantenga.
Sin embargo, todos estos miniepisodios quedan registrados. Usted no es más dueño de lo que hizo, sino que ha dejado una cantidad de rastros/huellas, algo así como si hubiera marcado con una tiza todo su trayecto. Fíjese que estoy omitiendo hablar del contenido de su conversación. Esa sería la preocupación más frecuente, por lo que significaría una obvia invasión a la privacidad. Pero hay otro tipo de datos que quedan registrados y que les otorgan a las telefónicas un poder descomunal. Es tan grande el poder que tienen con esa base de datos, es tan extraordinaria su potencialidad, que creo que debería discutirse si ese material les pertenece o si debiera ser regulado por el Estado. No sé. No he pensado el tema y estoy seguro de que habrá gente experta que tendrá opiniones educadas. La mía, ciertamente no lo es. Pero quiero explayarme un poco más en por qué considero que esa base de datos contiene adentro una cantidad de información que podría cooperar en la solución de muchísimos problemas. ¿De qué hablo? Me explico, primero con un ejemplo.
Nicolás Ponieman, Alejo Salles y Carlos Sarraute 2) son tres científicos argentinos egresados de la universidad pública. Trabajan –entre otras cosas– como asesores/consultores de distintas compañías telefónicas que proveen servicios de telefonía celular. Cada una de estas compañías es poseedora de los datos de los que hablaba más arriba. Es decir: las compañías tienen registradas todas las llamadas entrantes y salientes que recibió cada teléfono, qué antenas fueron utilizadas y durante cuánto tiempo. Las empresas codifican los números de los usuarios de manera tal que al entregar el material, no sólo no aparece nada de lo conversado, sino que tampoco aparece el número del usuario: es un código. Por supuesto, el código de cada teléfono será siempre el mismo a lo largo de cualquier estudio y/o uso que se haga con ellos. Por otro lado, los resultados que provengan del análisis de esos datos solamente pueden ser utilizados con un fin académico (científico) y, más aún, tienen que aparecer ubicados en distintas categorías (“agregados”), sin individualizar ni revelar los detalles (en particular, el nombre de la empresa).
Para que tenga una idea de la magnitud del trabajo, piense que analizaron 40 millones de teléfonos celulares. El objetivo era hacer un estudio que permita mejorar la predictibilidad de los movimientos y la ubicación de grupos de personas. Es decir, en este caso particular, estudiaron los movimientos de los que llamaron “hinchas de Boca”. ¿Cómo hacer para detectar quiénes pertenecen a ese grupo? Se propusieron identificar a los usuarios que hicieron llamadas en zonas aledañas a la cancha de Boca durante varios domingos seguidos en horarios de partido y usaron ese material para distinguir/elegir algunos teléfonos celulares de otros. No alcanza con que una persona hubiera ido a la cancha de Boca con un teléfono celular, sino que para que quede un registro tiene que haber hecho o recibido alguna llamada en el lapso que se fijaron para el estudio 3). Por supuesto, no se les escapa a ellos ni a usted que es una identificación muy grosera, pero, a los efectos prácticos, es una buena aproximación.
Como decía más arriba, el objetivo era poder predecir la locación y la movilidad de los teléfonos celulares de personas que pertenecían a ese grupo (“hinchas de Boca”) en un determinado momento.
En esta suerte de prueba piloto quise saber cuáles eran las hipótesis que tenían antes de hacer el relevamiento y cuáles fueron las conclusiones que terminaron publicando.
Las hipótesis que querían verificar con este estudio fueron:
+ que la movilidad de las personas presenta –a nivel estadístico– muchas regularidades (se pueden predecir con alta probabilidad de acierto).
- que la ubicación de los usuarios de celular se puede predecir también con una buena probabilidad de acierto. 4)
- que el modelo muy simple utilizado se puede mejorar sensiblemente agregando información “externa” de fenómenos sociales, como por ejemplo fue haber utilizado el fixture del torneo de fútbol.
Luego, una vez finalizado el estudio, corroboraron todas esas hipótesis. El trabajo fue presentado con marcado éxito en el congreso NetMob que se hizo a principios de mayo de este año en el MIT, en Boston, Massachusetts (EE.UU.) 5)
Por supuesto, conocer dónde están (o no) los hinchas de Boca tiene una utilidad relativa. En todo caso, servirá para los servicios de marketing que seguramente estarían interesados en conocer este material.
Pero lo que yo quiero poner en evidencia acá es que con esos datos es posible –por ejemplo– analizar el flujo de personas que ingresan (y egresan) del centro de una ciudad, para mejorar y optimizar la distribución del transporte público, de ofrecer rutas alternativas, de guiar al tránsito en tiempo real (como se hizo en un estudio espectacular con la misma idea en Costa de Marfil). O bien aprovechar los datos que dejaron los teléfonos celulares en Haití luego del terremoto del año 2010, para entender cómo se produce la dispersión de personas luego de una catástrofe natural.
Un trabajo equivalente con cualquier base de datos de similares características permite mejorar la predictibilidad en la movilización y ubicación de las personas involucradas, pero al mismo tiempo, este mismo tipo de modelos permite predecir y entender procesos más complejos tales como la forma en la que se desparrama o distribuye la información, o incluso un rumor, o cuáles son los patrones con los que se esparce un virus o una enfermedad contagiosa. Y los ejemplos podrían seguir.
Cada día el mundo digital genera varios millones de millones de millones de bytes [6] que provienen de múltiples fuentes: sensores climáticos, redes sociales, imágenes digitales, videos subidos a Internet o compras hechas usando la red y, como está explicado más arriba, las llamadas efectuadas por usuarios de teléfonos celulares, por sólo nombrar algunas. El aprovechamiento de todos estos datos, saber desbrozarlos, desagregarlos, entenderlos y rescatar los mensajes que tienen escondidos, es uno de los mayores desafíos de la tecnología de la información. De momento, las compañías telefónicas recogen y almacenan una cantidad de datos que si es bien interpretada puede proveer una información macroscópica muy valiosa sobre las interacciones de la población. Justamente, el análisis cuidadoso de ellos puede transformarse entonces en una herramienta muy poderosa para mejorar esas interacciones, optimizarlas... La Argentina no puede quedarse atrás. Y una vez más: ¿no valdría la pena discutir si esas bases de datos deberían ser reguladas por el Estado también? ¿No debería tener el Estado acceso a esa información para mejorar las condiciones de vida de la población? ¿Usted qué piensa?
1) ¿No es notable que haya guías de teléfonos con líneas fijas, pero no de celulares?
2) Nicolás Ponieman es estudiante de la licenciatura en Física, en Exactas (UBA); Alejo Salles es egresado de Exactas (UBA) y doctor en Física de la Universidade Federal do Rio de Janeiro (UFRJ); y Carlos Sarraute es egresado de Exactas (UBA) y doctor en Ingeniería Informática del ITBA. Ponieman y Sarraute trabajan en la compañía Grandata mientras que Salles es investigador del Conicet.
3) Cada llamada se identifica por su nombre en inglés, CDR, Call Detail Record, o sea la “huella” que dejó la llamada.
4) Para preparar el modelo, usaron un conjunto de antenas que les sirvieron como entrenamiento durante cinco semanas.
5) El trabajo puede verse acá: http://www.technologyreview.com/news/514646 /glimpses-of-a-world-revealed-by-cell-phone-data/ y forma parte de Third Conference on the Analysis of Mobile Phone Dataset (“Tercera Conferencia sobre el Análisis de la Base de Datos de los Teléfonos Móviles”).
6) Millones de millones de millones es equivalente a 1018, o sea un uno seguido de ¡dieciocho ceros!
(Versión para móviles / versión de escritorio)
© 2000-2022 www.pagina12.com.ar | República Argentina
Versión para móviles / versión de escritorio | RSS
Política de privacidad | Todos los Derechos Reservados
Sitio desarrollado con software libre GNU/Linux