Pekín, 26 mar (EFE).- La firma tecnológica china DeepSeek presentó este mes una versión actualizada de su modelo fundacional de inteligencia artificial, el DeepSeek-V3-0324, con mejoras destacadas en generación de código y razonamiento matemático, según datos compartidos por la propia empresa.
El nuevo modelo, basado en el sistema de razonamiento R1 y con 685.000 millones de parámetros, ha sido desarrollado como una herramienta de propósito general, útil tanto para asistentes conversacionales como para tareas de desarrollo web.
A diferencia de versiones anteriores, está disponible bajo la licencia MIT, un tipo de permiso de código abierto que permite el uso, modificación y redistribución del software sin restricciones comerciales, y que es la más utilizada en la plataforma para desarrolladores GitHub.
Entre los avances más notorios, logró una puntuación de 59,4 en la American Invitational Mathematics Examination (AIME), una prestigiosa prueba de matemáticas en EE. UU., superando con holgura los 39,6 alcanzados por su antecesor.
En pruebas de programación como LiveCodeBench, logró una mejora de 10 puntos, alcanzando 49,2.
El modelo fue capaz de generar más de 800 líneas de código sin errores y más de 20 tókens por segundo, una unidad de medida que representa fragmentos de texto —por ejemplo, palabras o caracteres— usados en el procesamiento de lenguaje natural.
El sistema se basa en una arquitectura conocida como Mixture-of-Experts (mezcla de expertos), que distribuye las tareas entre diferentes módulos especializados para aumentar la eficiencia sin elevar de forma significativa el coste computacional.
Usuarios e ingenieros especializados subrayaron que el modelo ha sido destacado por su precisión en matemáticas, su capacidad para generar código funcional a gran escala y su potencial para competir con las principales firmas del sector.
El modelo, disponible en Hugging Face, un repositorio global donde desarrolladores e investigadores comparten modelos de IA de acceso abierto, y en las plataformas oficiales de DeepSeek, ya ha sido integrado en servicios en la nube de startups como Hyperbolic.
“Las capacidades de codificación son mucho más fuertes, y la nueva versión podría allanar el camino para el lanzamiento del R2”, afirmó Li Bangzhu, fundador del sitio especializado AIcpb.com, citado por el diario hongkonés South China Morning Post.
Este avance se produce en un contexto de fuerte competencia tecnológica entre China y Estados Unidos.
Washington ha impuesto controles a la exportación de semiconductores avanzados, esenciales para entrenar modelos de IA, y ha planteado vetos a aplicaciones chinas como TikTok.
Pekín, por su parte, mantiene el bloqueo a servicios estadounidenses como Google, Facebook, X o Instagram, y exige que los sistemas de IA respeten los “valores socialistas fundamentales”, prohibiendo contenidos que pongan en riesgo la seguridad nacional o la unidad territorial.
Pese a su crecimiento, DeepSeek ha enfrentado críticas fuera de China. En países como Australia, algunos organismos han restringido su uso por motivos de seguridad.
Además, sus modelos evitan responder sobre temas sensibles para el Gobierno chino, como la masacre de Tiananmen de 1989 o la situación de Taiwán, lo que ha generado cuestionamientos sobre su neutralidad informativa.
¡Mantente informado! Síguenos en WhatsApp, Telegram, Instagram, Facebook o X