Dall-E es tendencia en las redes sociales desde hace varias semanas. Desde que los usuarios conocieron el potencial del sitio web que genera imágenes por inteligencia artificial de todo tipo a partir de una indicación textual, muchos buscaron hacer "realidad" ideas de lo más experimentales.
En Twitter y otras aplicaciones, por dar un ejemplo, se crearon cuentas particulares dedicadas exclusivamente a difundir las ilustraciones más divertidas y originales que realizan internautas de todo el mundo a partir del desarrollador web de arte realista más conocido del momento.
"Capitán América dándole una paliza a Donald Trump", "Jesús convirtiendo el agua en vino en America's Got Talent", "Impresora que imprime spaguetti", "Demogorgon de Stranger Things sosteniendo una pelota", "Darth Vader y Diego Maradona tomando el té", son algunas de las expresiones de la imaginación que pudieron plasmarse en una imagen creada por computadora y que se hicieron virales en el último tiempo.
Y aunque algunas imágenes se ven más fieles al texto original que otras, lo cierto es que el fenómeno no deja de ser un boom en todo el mundo. Pero, ¿cómo es posible que un sitio web pueda traducir cualquier idea o intención de la imaginación en una ilustración hecha por computadora?
¿Qué es Dall-E?
La responsable de este éxito cibernético es la empresa estadounidense oriunda de San Francisco, OpenAI, dedicada a la investigación e implementación de la inteligencia artificial. De acuerdo a su sitio web, la compañía tiene como "misión" poder "asegurar que la inteligencia artificial general beneficie a toda la humanidad".
Dall-E es su proyecto más famoso. Fue lanzado en enero del 2021. Su nombre es un juego de palabras entre el pintor surrealista Salvador Dalí, y el simpático robot Wall-E, de la película de Pixar. Es capaz de desarrollar imágenes con palabras a partir de un algoritmo que utiliza "12 mil millones de parámetros" de GPT-3, una herramienta "entrenada para generar imágenes a partir de descripciones de texto utilizando un conjunto de datos pares de texto e imagen".
"GPT-3 demostró que el lenguaje se puede usar para instruir a una gran red neuronal para que realice una variedad de tareas de generación de texto. Image GPT demostró que el mismo tipo de red neuronal también se puede utilizar para generar imágenes con alta fidelidad. Ampliamos estos hallazgos para mostrar que la manipulación de conceptos visuales a través del lenguaje está ahora al alcance de la mano", detalló la compañía en su blog.
Dall-E 2: en busca de la perfección
El paso del tiempo le demostró a OpenAI que su proyecto recibió una gran aceptación a escala global y lo impulsó a seguir profesionalizando su desarrollador de inteligencia artificial. Es por eso que meses después, Dall-E 2 llegó con el fin de crear "imágenes más realistas y precisas con una resolución 4 veces mayor" que su antecesor.
"Dall-E 2 es preferible a Dall-E 1 por su coincidencia de subtítulos y fotorrealismo cuando se pidió a los evaluadores que compararan 1000 generaciones de imágenes de cada modelo. (Según las encuestas), 71,7% (de los usuarios) lo prefirió por la coincidencia de subtítulos y un 88,8% lo eligió por el fotorrealismo", indica la empresa en su blog.
No obstante, la compañía estadounidense informó que hasta terminar con sus investigaciones y "desarrollar e implementar IA de manera responsable", no ofrecerán este servicio más moderno al público.
En este sentido, OpenIa contó que estudiaron las limitaciones y capacidades de Dall-E con un grupo selecto de usuarios para prevenir la generación de imágenes dañinas, violentas, de odio o para adultos, como el contenido explícito o la creación de ilustraciones muy realistas de rostros de personas reales y figuras públicas. También señalaron que invirtieron en "sistemas de monitoreo automatizados y humanos para protegerse contra el uso indebido".
Cómo hacer que Dall-E dibuje lo que quieras
Para poner a prueba Dall-E y jugar con la imaginación, basta con entrar al sitio web de Dall-E mini, escribir en el comando la idea que se tenga -en inglés, preferiblemente- y ejecutar.
Se sugiere utilizar frases simples y naturales, por ejemplo: "Power Rangers meet Lady Gaga" (Los Power Rangers se encuentran con Lady Gaga). Pasados unos minutos, el sitio web arrojará la composición final en pantalla. No hay límites. Si se puede imaginar, se puede dibujar.
Cómo solucionar el error de "demasiado tráfico"
En algunos casos el dibujo tarda demasiado en generarse. Otras, aparece un cartel que indica que hubo un error porque el sitio tiene "demasiado tráfico". Esto se debe a que el servidor colapsó por la cantidad de usuarios que están intentando realizar composiciones gráficas al mismo tiempo.
¿La solución? Intentar reiteradas veces hasta que tome el pedido. Otra opción para resolverlo sería cambiar la formulación textual de un modo más simple de leer para el desarrollador.
Las 5 imágenes más desopilantes de Dall-E
- Explosión de una bomba nuclear de brócoli:
- SpaceX despega el monumento de Jesús crucificado:
- Sonic invitado especial en un capítulo de Friends:
- Tinky Winky le da la mano a Barack Obama:
- Internet Explorer "se va al cielo":