CIENCIA › ENRIQUE SEGURA, MATEMATICO
Las redes neuronales, que fueron uno de los grandes modelos y vías de la computación, son capaces de aprender, de enfrentarse con datos incoherentes y ejercer rudimentos de aprendizaje.
› Por Leonardo Moledo
Estamos tan acostumbrados a la PC de escritorio –un aparato que, en última instancia, sólo ejecuta órdenes– que olvidamos frecuentemente que no es el único paradigma posible de computación. Esta disciplina tomó muchos y diferentes caminos; algunos de ellos trataban de imitar los procesos cognitivos de los seres humanos (o de los animales), intentando operar en medio de fárragos de datos incoherentes. Otras tentativas, en cambio, fueron las de diseñar máquinas capaces de aprender: las redes neuronales responden justamente a un modelo de computación de este tipo, en el que la computadora, enfrentada a un conjunto de datos, va reuniendo información como para actuar después en circunstancias parecidas y en el reino ambiguo del “más o menos”. Es el tema de trabajo de Enrique Segura, doctor en matemáticas, profesor con dedicación exclusiva del Departamento de Computación de la Facultad de Ciencias Exactas y Naturales de la UBA.
–Hábleme de las redes neuronales.
–Bueno, vamos a empezar por un tema: yo me dedico a lo que en general se puede llamar modelos conexionistas en particular, lo más conocido de toda esta disciplina...
–Son las redes neuronales.
–Pero las redes neuronales forman parte de todo un enfoque más amplio tanto de la forma de entender los procesos cognitivos como de modelar los procesos de computación o las formas de hacer computación. Me interesan mucho las propiedades de las redes neuronales, lo cual no quita que también me haya embarcado en proyectos que buscan aplicaciones, por un lado computacionales y por otro lado como aproximación al aparato cognitivo natural de los seres vivos en general.
–Tratar de imitar mediante redes neuronales computacionales las redes neuronales biológicas.
–Sí, tratando por un lado de desarrollar redes neuronales artificiales en base a lo que sabemos de las redes neuronales biológicas reales y por otro lado tratando de conocer algo más, modelar a partir de lo artificial, y conocer algo más de los sistemas nerviosos y de su forma de aprender, memorizar y pensar en la naturaleza.
–Pero, en definitiva, ¿qué es una red neuronal?
–Una red neuronal es un modelo formal, son, digamos, pequeños procesadores que intentan resumir en una forma muy simple las propiedades que se considera que poseen las neuronas que son las unidades básicas del sistema nervioso.
–Funcionan como neuronas.
–La red neuronal intenta, a partir de pequeñas partecitas que tienen una pequeña capacidad, es decir, tiene un quantum de inteligencia muy pequeño, construir sistemas de muchos miles o cientos de miles de estos pequeños procesadores que se comporten con una dinámica, donde aparezcan, emerjan propiedades cualitativamente superiores en cuanto a inteligencia, que es lo que se supone que ocurre en el sistema nervioso. Es decir, una neurona sola es muy poco lo que puede hacer.
–Pero es mucho mediante la interacción con los cientos de miles, o cientos de millones.
–Como hay realmente en el sistema nervioso humano, se obtiene la maravilla y el misterio que sabemos que son las capacidades de conocimiento, de razonamiento, etc. que el hombre posee.
–Es decir, usted simula redes de neuronas en una computadora.
–Exactamente... Simular los procesos hasta donde las ciencias naturales conocen; están subyaciendo a las habilidades cognitivas e intelectuales que posee... digamos un ente de la naturaleza en general, no necesariamente el ser humano.
–¿Me puede dar un ejemplo?
–Bueno, por ejemplo vamos a poner una habilidad muy trivial que cualquier mamífero posee, que es la capacidad de, ante un estímulo doloroso –por ejemplo una fuente de calor–, evitarlo. Existen sensores, en este caso táctiles; después hay una señal que se transmite a todo un complicado sistema de neuronas y generalmente hay una respuesta que es una salida accionada por una neurona motora.
–Y usted reproduce ese comportamiento.
–Esto es modelado exactamente como un sistema, con una entrada, que es el estímulo, una red de conexiones y una salida deseada que es la respuesta a ese estímulo, en este caso evitar la quemadura. Lo cual supone que el sistema de alguna manera visto como una caja negra va a tener que aprender una serie de parámetros en base a estímulos. Cada vez que reciba un estímulo va a tener que decidir si ese estímulo es peligroso o no y generar la respuesta correcta.
–Eso es aprendizaje.
–Justamente el concepto de aprendizaje es muy importante en nuestros modelos, el sistema es capaz finalmente de ajustar ante cada estímulo una respuesta adecuada.
–No es un modelo clásico.
–No, claro, éste es un modelo intrínsecamente distinto del modelo de computación clásico, donde al sistema hay que darle una serie de instrucciones específicas sobre cómo comportarse ante cada posible entrada, cómo generar una salida. En las redes neuronales se trata de emular la forma en que un ser vivo es realmente programado en interacción con su medio, es decir a los seres humanos o a los animales en general nadie los programa. Vamos aprendiendo a generar respuestas a los estímulos que recibimos mediante prueba y error.
–Y en cuanto a ejemplos más complejos que éste...
–Bueno, nos vamos al otro extremo. Por ejemplo, se han desarrollado modelos de redes neuronales capaces de analizar textos y aprender por ejemplo el estilo de los sonetos de Shakespeare. Uno se preguntaría para qué puede servir: bueno, sabemos que hay muchas obras atribuidas a autores muy grandes que son apócrifas y muchas veces en este caso los filólogos o los especialistas están interesados en discriminar cuáles son las obras genuinas y cuáles las apócrifas. Bueno, se han desarrollado modelos donde se le enseña a una red neuronal, se le proveen ejemplos de obras consideradas genuinas, en este caso sonetos genuinos de Shakespeare y otros ejemplos donde se sabe positivamente que son obras que no fueron compuestas por Shakespeare.
–Supongo que muy supervisadamente.
–Desde ya: cada vez que se le presenta una de las buenas, se le enseña que la salida debe ser verdadera, cada vez que se le presenta una de las falsas, se le enseña que la salida debe ser falsa. Y la red va aprendiendo. Y se asume que la red puede inferir mediante su dinámica interna lo que muy posiblemente el hombre o en este caso el experto no ha sido capaz de formular en términos explícitos.
–Las redes neuronales en cierto modo pueden decidir.
–Bueno, lo que sí es muy sabido es que las redes neuronales como modelo de procesamiento tienen características de gran tolerancia a todo lo ambiguo, a todo lo difuso. La computadora convencional, por ejemplo, no soporta información inconsistente, es decir, afirmaciones que se contradicen entre sí; las redes neuronales tienen la posibilidad de manipular información incompleta o autocontradictoria, en el sentido en que se afirman cosas que se excluyen mutuamente.
–¿Y obtener información coherente?
–Y obtener información coherente a partir de información que no es del todo coherente. ¿Por qué? Porque la red tiene en su funcionamiento una gran incidencia del componente estadístico, es decir una gran masa de datos soportando o apoyando una afirmación y puede lograr que una pequeña porción de datos que soporta o apoya la información contraria quede reducida a, por ejemplo, ruido.
–¿Cuál es el panorama de las redes neuronales dentro de la ciencia de la computación? En una época pareció que eran el gran camino, la gran vía. No sé ahora.
–Bueno, ahora, sí, es cierto, no son lo que fueron en los ’80... los enfoques que finalmente se impusieron son los de la computadora de Von Neuman, que es la computadora que tenemos arriba del escritorio, la computadora que básicamente es una unidad de proceso que lee instrucciones, en la memoria principal o en un dispositivo de un disco, y va sufriendo transformaciones sobre los datos de entrada perfectamente prefijadas y conocidas por el programador y produce una salida. Ese paradigma con todas sus limitaciones demostró que tecnológicamente es muy apto para ser llevado a los fierros, digamos. Hubo otros enfoques que tuvieron menos éxito, como por ejemplo los autómatas celulares.
–¿Y las redes neuronales?
–Surgen muy paralelamente a esos otros enfoques, pero en la década del ’80 sí, parecía que iban a ser una revolución en el paradigma computacional y en el intento de comprender un poco más los procesos cognitivos de los seres vivos.
–¿Y hoy?
–Hoy en día nadie niega que constituyen un paradigma computacional absolutamente original, y compiten con un montón de paradigmas novedosos... bueno, hay muchos términos: machine learning, es decir aprendizaje de máquina, aprendizaje automático, el más conocido de todos esos nombres es inteligencia artificial, y más recientemente han aparecido otros nombres como data mining. Está otra área clásica que es la de los “sistemas difusos”, es decir hay todo un pool de enfoques de modelos alternativos al modelo computacional imperante, hegemónico. Por supuesto que aquí hay mucha incidencia de otros factores: factores económicos, factores culturales, que hacen que no vaya a ser fácil que otro modelo computacional, digamos, compita fácilmente con el modelo que llamamos procedural, la computadora de Von Neuman.
–Pero las redes neuronales siguen en la brecha.
–Siguen despertando interés, sobre todo mucho interés teórico y el interés teórico que tienen creo que es difícil que se agote y bueno, se mantienen. Yo diría que pasado el primer momento de euforia, no se las olvida. Siguen ahí, como una vía alternativa.
(Versión para móviles / versión de escritorio)
© 2000-2022 www.pagina12.com.ar | República Argentina
Versión para móviles / versión de escritorio | RSS
Política de privacidad | Todos los Derechos Reservados
Sitio desarrollado con software libre GNU/Linux