PEKÍN – La empresa tecnológica china Alibaba (9988.HK), abre una nueva pestañaEl miércoles lanzó una nueva versión de su modelo de inteligencia artificial Qwen 2.5 que, según afirmó, superó al aclamado DeepSeek-V3.
El momento inusual del lanzamiento del Qwen 2.5-Max, el primer día del Año Nuevo Lunar, cuando la mayoría de los chinos están fuera del trabajo y con sus familias, apunta a la presión que el meteórico ascenso de la startup china de inteligencia artificial DeepSeek en las últimas tres semanas ha ejercido no solo sobre sus rivales extranjeros, sino también sobre su competencia nacional.
«Qwen 2.5-Max supera… casi en todos los aspectos a GPT-4o, DeepSeek-V3 y Llama-3.1-405B», dijo la unidad de nube de Alibaba en un anuncio publicado en su cuenta oficial de WeChat, refiriéndose a OpenAI y los modelos de inteligencia artificial de código abierto más avanzados de Meta.
El lanzamiento el 10 de enero del asistente de inteligencia artificial de DeepSeek, impulsado por el modelo DeepSeek-V3, así como el lanzamiento el 20 de enero de su modelo R1, ha conmocionado a Silicon Valley y ha provocado que las acciones tecnológicas se desplomen, y los costos supuestamente bajos de desarrollo y uso de la startup china llevaron a los inversores a cuestionar los enormes planes de gasto de las principales empresas de inteligencia artificial en los Estados Unidos.
Pero el éxito de DeepSeek también ha provocado una lucha entre sus competidores nacionales para actualizar sus propios modelos de IA.
Dos días después del lanzamiento de DeepSeek-R1, el propietario de TikTok, ByteDance, lanzó una actualización de su modelo insignia de IA , que afirmó que superó al o1 de OpenAI respaldado por Microsoft en AIME, una prueba de referencia que mide qué tan bien los modelos de IA comprenden y responden a instrucciones complejas.
Esto hizo eco de la afirmación de DeepSeek de que su modelo R1 rivalizaba con el o1 de OpenAI en varios puntos de referencia de rendimiento.
DEEPSEEK FRENTE A COMPETIDORES NACIONALES
El predecesor del modelo V3 de DeepSeek, DeepSeek-V2, desencadenó una guerra de precios de modelos de IA en China después de su lanzamiento en mayo pasado.
El hecho de que DeepSeek-V2 fuera de código abierto y extremadamente barato (solo 1 yuan (0,14 dólares) por cada millón de tokens, o unidades de datos procesadas por el modelo de IA), llevó a la unidad en la nube de Alibaba a anunciar recortes de precios de hasta el 97 % en una variedad de modelos.
Otras empresas tecnológicas chinas siguieron su ejemplo, incluida Baidu (9888.HK)., abre una nueva pestaña, que lanzó el primer equivalente chino de ChatGPT en marzo de 2023, y la empresa de Internet más valiosa del país, Tencent (0700.HK)., abre una nueva pestaña.
Liang Wenfeng, el enigmático fundador de DeepSeek , dijo en una rara entrevista con el medio de comunicación chino Waves en julio que a la startup «no le importaban» las guerras de precios y que lograr AGI (inteligencia general artificial) era su principal objetivo.
OpenAI define AGI como sistemas autónomos que superan a los humanos en las tareas económicamente más valiosas.
Mientras que las grandes empresas tecnológicas chinas como Alibaba tienen cientos de miles de empleados, DeepSeek opera como un laboratorio de investigación, integrado principalmente por jóvenes graduados y estudiantes de doctorado de las mejores universidades chinas.
Liang dijo en su entrevista de julio que creía que las compañías tecnológicas más grandes de China podrían no ser las más adecuadas para el futuro de la industria de la IA, contrastando sus altos costos y estructuras de arriba hacia abajo con la operación ágil y el estilo de gestión flexible de DeepSeek.
«Los grandes modelos fundacionales requieren innovación continua, las capacidades de los gigantes tecnológicos tienen sus límites», afirmó.