El lanzamiento de nuevos modelos de inteligencia artificial de la startup china DeepSeek, que dice están a la par o son mejores que los líderes del sector en Estados Unidos y a un coste mucho menor, amenaza con alterar el orden mundial de la tecnología. 

Las acciones de empresas tecnológicas de todo el mundo, como el fabricante de semiconductores Nvidia (cuyos chips son los más elegidos para impulsar las aplicaciones de inteligencia artificial) se han desplomado este lunes en Bolsa con el aumento de la popularidad de DeepSeek, que ha hecho tambalear la esperanza de los inversores en la voraz demanda de procesadores de alta tecnología por parte del sector de la IA. Otros fabricantes de servidores de IA como Dell Technologies y Super Micro Computer también caen con fuerza, igual que los gigantes tecnológicos Microsoft, Meta y Alphabet (la matriz de Google).

La startup china ha lanzado un asistente gratuito que, según asegura, utiliza chips de bajo costo y menos datos, lo que parece contrariar una apuesta generalizada en los mercados financieros de que la IA impulsará la demanda en toda la cadena de suministro, que va desde los fabricantes de chips hasta los centros de datos.

La startup ha atraído la atención en los círculos mundiales de la IA después de escribir en un artículo el mes pasado que el entrenamiento de DeepSeek-V3 requirió menos de 6 millones de dólares de potencia de cálculo de los chips Nvidia H800.

El asistente DeepSeek, basado en DeepSeek-V3, llegó a App Store el pasado 11 de enero y, desde entonces, ha escalado situarse en el primer puesto en las listas de descargas gratuitas de la tienda de aplicaciones de Apple tanto en China como en EEUU, superando al popular ChatGPT, de la firma OpenAI.

El asistente DeepSeek, además de responder preguntas en un formato conversacional, puede navegar por la web para ofrecer respuestas actualizadas, resumir documentos de texto de manera rápida y utilizar el razonamiento para resolver problemas complejos.

Su modelo es de código abierto, con lo que cualquier persona puede examinarlo, modificarlo y desarrollarlo en función de sus necesidades, algo que ha generado un notable impacto en la comunidad de desarrolladores, que destaca su eficiencia y bajo costo. Asimismo, la compañía ha hecho públicos detalles técnicos de los procesos de entrenamiento del modelo, lo que permite a otros usuarios utilizarlos como base para desarrollar otras herramientas.

Lo ocurrido ha suscitado dudas sobre el razonamiento que subyace a la decisión de algunas empresas tecnológicas estadounidenses de destinar miles de millones de dólares a inversiones en IA, y las acciones de varias, incluida Nvidia, se han visto afectadas.

Los expertos señalan que DeepSeek "redefinirá las reglas" de las IA con su enfoque de bajo coste. Las comparativas de precios se basan en el cálculo de tókenes, donde 1.000 equivalen aproximadamente a 750 palabras en inglés. DeepSeek ofrece servicios de interfaz de programación de aplicaciones (API) a un costo de 1 yuan (0,14 dólares, 0,13 euros) por millón de tókenes de entrada y 16 yuanes (2,2 dólares, 2,1 euros) por millón de tókenes de salida. En comparación, el modelo o1 de OpenAI tiene un precio de 15 dólares (unos 14,4 euros) por millón de tókenes de entrada y 60 dólares (aproximadamente 57 euros) por millón de tókenes de salida.

¿Por qué DeepSeek está causando tanto revuelo?

El lanzamiento de ChatGPT de OpenAI a finales de 2022 provocó un revuelo entre las empresas tecnológicas chinas, que se apresuraron a crear sus propios chatbots basados en inteligencia artificial. Sin embargo, tras el lanzamiento del primer equivalente chino de ChatGPT, creado por el gigante de los motores de búsqueda Baidu, hubo una decepción generalizada en China por la diferencia de capacidades de IA entre las empresas estadounidenses y chinas.

La calidad y la rentabilidad de los modelos de DeepSeek han cambiado la narrativa. DeepSeek-V3 y DeepSeek-R1, los dos modelos que han sido objeto de elogios por parte de ejecutivos de Silicon Valley e ingenieros de empresas tecnológicas estadounidenses, están a la altura de los más avanzados de OpenAI y Meta, según la empresa china.

Además, son más baratos. El DeepSeek-R1, lanzado la semana pasada, es entre 20 y 50 veces más barato de usar que el modelo o1 de OpenAI, dependiendo de la tarea, según un post en la cuenta oficial de WeChat de DeepSeek.

No obstante, algunos han expresado públicamente su escepticismo sobre el éxito de DeepSeek. El presidente ejecutivo de la compañía Scale AI, Alexandr Wang, aseguró el jueves durante una entrevista con la cadena CNBC, sin aportar pruebas, que DeepSeek cuenta con 50.000 chips Nvidia H100, que, según dijo, no se revelarían porque violarían los controles de exportación de Washington, que prohíben vender chips de IA tan avanzados a empresas chinas. DeepSeek no respondió inmediatamente a una solicitud de comentarios sobre la acusación.

Los analistas de Bernstein destacaron el lunes en una nota de investigación que se desconocían los costos totales de formación de DeepSeek para su modelo V3, pero que eran mucho más elevados que los 5,58 millones de dólares que la startup dijo haber empleado en potencia de cálculo. Agregaron que no se habían revelado los costos de formación del modelo R1, igualmente aclamado.

¿Quién está detrás de DeepSeek?

DeepSeek es una startup con sede en Hangzhou cuyo accionista mayoritario es Liang Wenfeng, cofundador del fondo de cobertura cuantitativa High-Flyer, según los registros corporativos chinos.

El fondo de Liang anunció en marzo de 2023 en su cuenta oficial de WeChat que estaba "empezando de nuevo", yendo más allá del comercio para concentrar recursos en la creación de un "grupo de investigación nuevo e independiente, para explorar la esencia de la AGI (Inteligencia General Artificial)". DeepSeek se creó ese mismo año.

Los creadores de ChatGPT OpenAI definen la AGI como sistemas autónomos que superan a los humanos en la mayoría de las tareas económicamente valiosas. No está claro cuánto ha invertido High-Flyer en DeepSeek, que tiene oficinas en el mismo edificio.

La empresa es también propietaria de patentes relacionadas con clusters de chips usados para entrenar modelos de IA, según los registros corporativos chinos. La unidad de IA de High-Flyer dijo en su cuenta oficial de WeChat en julio de 2022 que posee y opera un clúster de 10.000 chips A100.

¿Qué opina Pekín de DeepSeek?

El éxito de DeepSeek ya se ha dejado notar en los altos círculos políticos chinos. El 20 de enero, día en que DeepSeek-R1 se hizo público, su fundador, Liang, asistió a un simposio a puerta cerrada para empresarios y expertos organizado por el primer ministro chino, Li Qiang, según la agencia estatal de noticias Xinhua.

La presencia de Liang en la reunión es potencialmente una señal de que el éxito de DeepSeek podría ser importante para el objetivo político de Pekín de superar los controles de exportación de Washington y lograr la autosuficiencia en industrias estratégicas como la IA. A un simposio similar celebrado el año pasado asistió el presidente ejecutivo de Baidu, Robin Li.

¿Qué busca China con esta aplicación de IA?

Algunas voces apuntan a que China busca que sus empresas ganen influencia global con este tipo de modelos para dar forma a los estándares y las prácticas internacionales de las IA, así como ganar mercado en los países en desarrollo.

Además, el lanzamiento de DeepSeek se produce al tiempo que el presidente estadounidense, Donald Trump, anunciaba el proyecto Stargate, que invertirá 500.000 millones de dólares en los próximos cuatro años para construir nuevos centros de datos para apoyar proyectos de IA.

DeepSeek llega también después de que Washington impusiese restricciones a la exportación a China de chips de alto rendimiento, como los desarrollados por Nvidia y AMD, a lo que Pekín respondió con llamadas a la innovación.