› Por Jorge Forno
La minería es una actividad que acompaña a la humanidad desde los confines de su historia. Separar metales y otros elementos de la corteza terrestre ha requerido de paciencia y de una trabajosa acumulación de conocimientos a lo largo de los siglos para mejorar las técnicas de purificación y aislamiento de sustancias. Desde la extracción de materia prima para la elaboración de pigmentos hasta los sueños de rápido enriquecimiento por el hallazgo de metales preciosos, la actividad minera ha tenido relación con la búsqueda de lo difícilmente accesible.
En la actualidad el tiempo de los intrépidos buscadores de metales parece extinguido, de la mano de los nuevos métodos extractivos que la tecnología provee, sin privarse de aristas controversiales. Y en una era marcada por la informática, el término minería adquiere un nuevo significado en el desarrollo de sistemas de data mining, o minería de datos.
Simplificando al extremo, podemos decir que estos sistemas permiten leer entre líneas las bases de datos, obteniendo a partir de ellas información no explicitada que puede ser relevante con distintos fines. Los sistemas de data mining operan como verdaderos exploradores que bucean en las profundidades de las bases de datos por medio de herramientas estadísticas y de inteligencia artificial. Y lo hacen de manera casi automática, detectando supuestas anomalías, repeticiones u otros factores que llaman la atención a programas informáticos especialmente dotados para ver datos llamativos donde aparentemente no los hay.
Si bien la minería de datos tomó impulso a partir del avance de la informática, buena parte de sus fundamentos provienen de postulados conocidos desde casi tres siglos atrás. Por entonces, un ministro presbiteriano llamado Thomas Bayes se destacó como un autor multifacético que produjo escritos que iban desde lo religioso hasta lo matemático. En su obra postuló el bautizado como Teorema de Bayes, un hallazgo de inalterable vigencia en el ámbito de las ciencias que permite explorar la probabilidad de que una causa sea responsable de un fenómeno efectivamente observado y analizar probabilidades previamente calculadas cuando se posee nueva información. Algo parecido –salvando las indudables distancias– a analizar el posible desarrollo de un partido de fútbol antes de jugarse y revisar el análisis después, con el resultado puesto. O como dice una frase popular, con el diario del lunes.
Los aportes de Bayes sobre la probabilidad inversa, sumados a los avances en el campo de la inteligencia artificial y la portentosa capacidad de procesamiento que adquirieron las computadoras en las últimas décadas son los ingredientes que –condimentados con una dosis de intereses económicos y políticos– nutren el desarrollo de sistemas de data mining. Es que la minería de datos es una herramienta muy versátil que permite –además de la para nada despreciable capacidad de explorar los vericuetos de las campañas deportivas– escudriñar información valiosa para una amplísima galería de actividades.
Leer entre líneas –una práctica casi tan vieja y humana como la minería– requiere cierto refinamiento tecnológico cuando se trata de información aparentemente inconexa, guardada en el inmenso océano de bits que representan los sistemas informáticos. Pero el esfuerzo vale la pena porque rastrear y organizar toda esa información, en principio oculta, permite descubrir jugosa información en terrenos tan disímiles como la medicina, el marketing comercial o la estrategia militar, sobre todo cuando se trata de la predicción de comportamientos o tendencias.
Parece ser que el primer estudio hecho y derecho relacionado con la minería de datos no involucró a cuestiones de trascendencia médica, científica o geopolítica, sino a un asunto más prosaico, pero de importancia comercial. Una cita clásica de la literatura vinculada al marketing trae el caso de la utilización de herramientas de data mining para resolver el enigma de por qué un grupo de clientes compraba en los súper simultáneamente cerveza y pañales los viernes a la tarde.
Las técnicas de data mining sirvieron para detectar que los clientes en cuestión eran padres jóvenes que dedicaban los fines de semana a cuidar a sus hijos y a consumir su bebida predilecta. Los datos fueron utilizados comercialmente para obtener un incremento de ventas acercando la sección de “cervezas” a la de “pañales”, simplificando el asunto a los sacrificados portadores de los paquetes de pañales, casi siempre voluminosos y no tan gratificantes como los de su cerveza preferida.
Con el tiempo, la minería de datos comenzó a ser aplicada para entender en qué circunstancias los clientes cambian sus preferencias, abandonando a un proveedor de productos o servicios, apuntando a explicar tanto las fugas de clientes más imperceptibles como las más masivas y rimbombantes. Y en el terreno de los servicios bancarios su uso se extendió al análisis de los fraudes, falsificaciones y corridas de diverso tenor.
La medicina se vale de la minería de datos para estudiar la efectividad de los tratamientos. En tiempos de historias clínicas digitalizadas, los datos escondidos en las gigantescas bases de datos acumuladas en hospitales y consultorios pueden facilitar el seguimiento de los tratamientos medicamentosos, las recuperaciones posquirúrgicas o el control de epidemias.
Por citar algunos casos, los estudios sobre diabetes que se realizan desde hace más de 10 años permitieron modificar los parámetros con que se evalúan los análisis clínicos a partir de enormes volúmenes de información obtenidos de pacientes estadounidenses. Y los análisis relacionados con el Parkinson condujeron a refinar los métodos de su diagnóstico temprano.
También en el terreno de la ingeniería genética y la biotecnología, las técnicas de data mining abren las puertas para el conocimiento más profundo de la relación entre las variaciones genéticas individuales y la predisposición a sufrir enfermedades que se consideran de origen genético.
No todas son rosas para el uso de la minería de datos en medicina. Aunque generalmente la información analizada mantiene en el anonimato, no está claro cómo obtener los consentimientos de enormes cantidades de pacientes para el uso de su información médica personal sin afectar su privacidad.
En muchos países los sistemas de defensa están implementando técnicas de data mining cada vez más sofisticadas y, paradójicamente, guardando en secreto buena parte de sus prácticas de implementación. El asunto adquiere entonces importancia estratégica y hace a la autonomía nacional. En nuestro país un desarrollo en este sensible terreno corre por cuenta del Departamento de Informática del Instituto de Investigaciones Científicas y Técnicas para la Defensa (Citedef). Allí está en marcha un proyecto que se orienta a desarrollar sistemas propios de data mining basados en software libre, y adaptados a las necesidades locales.
La minería de datos asimismo adquiere protagonismo en actividades de espionaje que opacarían las mejores historias de ficción. Cada vez más usadas en el control de las fronteras y el movimiento de personas y mercaderías, a estas técnicas se les atribuye la resonante detección de algunos responsables de los atentados del 11 de septiembre de 2001 en Nueva York, y la capacidad de haber desactivado a tiempo otros hechos potencialmente similares.
La cuestión del uso de datos supuestamente privados por estas herramientas informáticas plantea un dilema ético, acerca de hasta dónde estos sistemas automatizados podrían hurgar en el monumental acopio de información que existe en las bases de datos, sin afectar los derechos de personas al resguardo de esa información. Quizá sea tiempo de pensar también en esta otra cara de la minería de datos, y no dejarnos cautivar sólo por las formidables capacidades tecnológicas que representa.
(Versión para móviles / versión de escritorio)
© 2000-2022 www.pagina12.com.ar | República Argentina
Versión para móviles / versión de escritorio | RSS
Política de privacidad | Todos los Derechos Reservados
Sitio desarrollado con software libre GNU/Linux