La empresa de Inteligencia Artificial (IA) OpenAI presentó este lunes ChatGPT-4o, la nueva versión gratuita, más rápida y con capacidades mejoradas de su popular 'chatbot', que está en el centro de la carrera tecnológica actual.
La jefa tecnológica Mira Murati, en una sesión abierta y retransmitida por internet, dijo que esta versión de la herramienta "mejora sus capacidades en texto, visión y audio", y que supone un "gran paso adelante" en su facilidad de uso.
El máximo ejecutivo de OpenAI, Sam Altman, destacó en la red social X que GPT-4o, el modelo en que se basa, es el mejor hasta la fecha, "multimodal", y que estará disponible para todos los usuarios, incluidos los del plan gratuito.
"Hasta ahora, los modelos de clase GPT-4 solo estaban disponibles para gente que paga una suscripción mensual. Esto es importante para nuestra misión, queremos poner grandes herramientras de AI en las manos de todos", agregó.
La presentación en vivo incluyó varias demostraciones de las capacidades del 'chatbot', que usaba una voz femenina y recordaba en cierto modo a la película 'Her', de Spike Jonze, sobre un humano que se enamora de una IA.
"Queremos eliminar el misticismo de la tecnología y llevársela para que puedan probarla ustedes mismos. En las próximas semanas, implementaremos estas capacidades para todos", dijo Murati, que adelantó que pronto habrá también novedades sobre "la siguiente frontera" en la IA.
Percepción de emociones y traducción simultánea de voz
La nueva versión de ChatGPT fue capaz de "percibir la emoción" de un usuario nervioso, le recomendó hacer respiraciones, bromeó con que parecía "una aspiradora", y mostró un rango de estilos y tonos en su voz leyendo un cuento para niños.
Entre otras cosas, el 'chatbot' ahora puede ser interrumpido y responder inmediatamente sin tardar segundos, resolver problemas matemáticos a través de vídeo, o hacer interpretación y traducción simultánea de idiomas de viva voz.
Murati también señaló que el nuevo modelo GPT-4o ofrece una nueva interfaz de usuario (IU) y una nueva aplicación de escritorio de ChatGPT para que todos "puedan usarlo allá donde estén" y se "integre fácilmente en la rutina de trabajo".
Asimismo, estará disponible para desarrolladores a través de la interfaz de programación de aplicaciones (API) de OpenAI con el objetivo de que estos puedan construir 'apps' usándolo, según dijo.
Carrera por la IA
Esta nueva versión del programa de OpenAI llega un día antes de una también esperada presentación de Google sobre su motor de búsqueda Gemini, su herramienta de IA que compite con ChatGPT.
Esta carrera detrás de los modelos de IA llevó a Microsoft (principal inversor de OpenAI) a convertirse en la mayor empresa del mundo por capitalización bursátil, arrebatando el primer puesto a Apple.
OpenAI y Microsoft disputan con Google el puesto de líder del sector, aunque Meta (matriz de Facebook) y Anthropic (con inversión de Amazon) también están haciendo sus armas para disputar un lugar.
Todas las empresas del rubro están intentando descifrar cómo cubrir los costos exorbitantes de la IA generativa, que en gran parte se va para la gigante estadounidense de los chips o semiconductores NVIDIA.
OpenAI ha firmado acuerdos de contenido con Associated Press, el Financial Times y Axel Springer, pero también se ha visto envuelta en una demanda judicial con el diario New York Times. También enfrenta diferentes demandas judiciales de artistas, músicos y autores en Estados Unidos.