Hace un poco más de siete años (abril del año 2014), Brian Hayes, un matemático norteamericano que escribe una columna mensual en la revista American Scientist, publicó un artículo con un título provocador: "Únicamente yo” [1]. Se preguntaba cuán fácil (o no) es identificar una persona entre los más de siete mil millones de habitantes de la Tierra. En realidad, fíjese que si cada uno de nosotros tuviera una línea telefónica única, alcanzaría con (¿quiere pensar?) trece dígitos. Por ejemplo, una persona que vive en la ciudad de La Plata, en la República Argentina, tendría un número de este tipo:

+549-221-429-1071

Está claro que el número 54 indica el código de país (Argentina es 54), el 9 indica que es un teléfono celular, los tres dígitos siguientes (221) marcan la Ciudad de La Plata, y después, el número propiamente dicho. Y este es sólo un ejemplo, porque en realidad, al formalizarlo de esta manera, estoy tomándome distintas licencias, ya que, por caso, todo bebé que nace, es como si le hubiera asignado un número de celular… pero, admítame que con 13 dígitos tendríamos el problema resuelto. Por supuesto, hay mejores formas de hacerlo, y de hecho, es fácil imaginarse otra: numerar a las personas de cada país. En ese caso, cualquier persona viva hoy, formaría parte de los siete mil y pico de millones que somos, y para eso alcanzan solamente diez dígitos. Por ejemplo, una persona que nació hoy, como todavía no llegamos a los ocho mil millones, tendrá un número de este tipo: 7.923.456.789.

Es decir, alcanzaría con 10 dígitos para identificar a cada persona -digamos- viva, pero solo para fijar las ideas. Como digresión al margen uno podría preguntarse: ¿cuántas personas nos precedieron? ¿Se podrá saber -seguro que hay estimaciones que yo ignoro- cuántos humanos poblaron la Tierra desde que esta existe como tal? Pero bueno, vuelvo a lo anterior: con siete o con diez dígitos podríamos distinguir a todas las personas que habitan nuestro planeta.

Me imagino que usted debe estar preguntándose: ¿hacia dónde va este buen hombre? Téngame un poco de paciencia y verá.

Supongamos que uno quiere llenar una encuesta en forma anónima, o quiere participar de algún experimento en donde no se le pida el nombre ni su número de documento. La idea es poder verter su opinión -como ha hecho múltiples veces en su vida- pero sin identificarse.

Las personas que prepararon la encuesta, no le piden el nombre ni su DNI ni nada, pero sí le piden que usted los provea de tres datos: su código postal (el de su residencia), su fecha de nacimiento y su género. Acá me voy a detener un instante.

La doctora Latanya Sweeney es profesora universitaria en la Escuela Harvard Kennedy, en Cambridge, Massachusetts en Estados Unidos. El curso que le ha dado el prestigio que tiene (y también la fama) es el que lleva el nombre: Technology and the Public Interest: From Democracy to Technocracy and Back (“Tecnología y el Interés Público: de la Democracia a la Tecnocracia, ida y vuelta”) sería mi traducción libre. Pero la preocupación mayor que ha tenido y tiene a lo largo de los años, es proteger la privacidad de todas las personas que utilizamos los medios digitales, sean teléfonos, computadoras, tabletas, internet en general, correos electrónicos, redes sociales… y usted agregue las que le parezcan pertinentes. Pero no me quiero olvidar de los registros que hay sobre los datos que diferentes instituciones guardan sobre su salud. ¿Con qué información alcanza para poder rastrear su identidad? Creo que con las que escribí ya tiene una idea.

Le quiero proponer algo más. Tome las páginas de internet que usted visitó -por ejemplo- en la última semana ¿Usted cree que hay mucha gente que recorrió exactamente los mismos sitios que usted? ¿O alcanzarán para identificarla/o? En algún sentido es como si cada uno de nosotros llevara consigo -así como su DNA o sus huellas dactilares o el iris de sus ojos o su cara- algo muchísimo más pedestre si me permite el término. Me explico: con los datos de su género, código postal y fecha de nacimiento, la Doctora Latanya Sweeney descubrió el ¡87 por ciento! de las personas que le entregaron esa información. Es decir, cuando uno cree que llena una encuesta en forma anónima, en realidad no es cierto. No sólo no es así sino que si usted viviera en Estados Unidos por ejemplo, y fuera al sitio https://aboutmyinfo.org/ y llenara esos datos, podría comprobar cuántas personas comparten con usted esos tres datos. Yo lo hice con múltiples personas que están relacionadas conmigo y que viven en el país del norte (exalumnos, colegas, amigas/os personales) y en todos los casos, mi interlocutor/a quedó aislado o detectado. No conseguí encontrar un solo ejemplo donde eso no hubiera sucedido.

Como indica Hayes en su artículo, suponga que en Estados Unidos viven 300 millones de personas (de acuerdo con el censo del año 2010 porque ahora, septiembre del 2021 se acaban de conocer los datos del censo realizado el año pasado, en épocas de pandemia), pero a los efectos de lo que quiero indicar acá la diferencia es irrelevante. De esas 300 millones de personas, supongamos que se reparten por mitades las mujeres y los hombres, y asumamos también que se distribuyen equitativamente en los 30.000 (treinta mil) códigos postales. Como hay 365 días en cada año (omito los bisiestos para hacer las cuentas más sencillas), suponiendo que uno toma la historia de 100 años, obtiene 36.500 posibles días para los natalicios de todas las personas vivas (queda claro que estoy incluyendo solamente aquellos que tienen a lo sumo 100 años). Por lo tanto, en cada uno de los códigos postales viven 5.000 hombres y 5.000 mujeres. La pregunta entonces es esta: si cada una de las 5.000 personas tiene una fecha de nacimiento elegida al azar entre las 36.500 posibilidades, ¿cuántas terminarán con una fecha no compartida por ningún otro miembro del mismo grupo? El número que resulta es ¡¡¡4.360, o sea un 87 por ciento!!!

Por supuesto que estas son condiciones ideales porque no es cierto que la distribución de las personas sea equitativa en cada una de las zonas que tienen un código postal diferente, ni se dividen exactamente por mitades entre hombres y mujeres, y todas las otras suposiciones que hice en el camino. Pero no importa. La idea es clara: no será el 87 por ciento, pero sí un número muy aproximado, por lo que usted … sí, usted, cuando cree que llena un formulario o una encuesta (o la situación que elija) en forma anónima, eso ¡no es cierto! Uno se está ‘auto-identificando’ sin siquiera saber que lo está haciendo.

El trabajo de la Doctora Sweeney comenzó en el año 1990, cuando era una estudiante de grado en el Massachusetts Institute of Technology (MIT). Cuando utilizó su teoría para identificar votantes (nada menos) de los 130 casos que le dieron a estudiar, ella y su grupo detectaron acertadamente a 121 con nombre y apellido. En 1997 Sweeney mostró cómo los datos demográficos que aparecen en los datos médicos que no tienen los nombres de los pacientes pueden vincularse a los registros de personas (por ejemplo, las listas de los votantes) para recuperar el nombre y la información de contacto a los datos médicos. Su primer ejemplo fue identificar la información médica de William Weld, ex gobernador de Massachusetts, usando solo su fecha de nacimiento, sexo y código postal que aparecía en una lista de votantes.

Nada de lo que escribí acá arriba ofrece certezas, pero en todo caso, sirve para estar atento. Lo que no sé, es si estamos a tiempo. Yo perdí el tren hace tiempo, pero a usted todavía le quedan varias oportunidades. Al menos, esté informada/o de lo que hace.

[1] https://www.americanscientist.org/article/uniquely-me