La disrupción de DeepSeek: la IA de China desafía el dominio de Estados Unidos

En enero de 2025, DeepSeek, una startup china de IA fundada en 2023 por Liang Wenfeng, surgió como un actor importante, desafiando el dominio de las empresas de IA estadounidenses como OpenAI. 

A pesar de los controles de exportación de Estados Unidos sobre tecnologías avanzadas, DeepSeek ha ganado rápidamente reconocimiento por sus modelos de IA avanzados, en particular el DeepSeek R1, que rivaliza con el o1 de OpenAI en capacidades de razonamiento.

Los modelos de IA de DeepSeek encabezaron rápidamente las listas de descargas y provocaron un debate sobre cómo la empresa logró tales avances a pesar de las restricciones estadounidenses. 

El inversor multimillonario Marc Andreessen elogió a DeepSeek R1 como “uno de los avances más asombrosos e impresionantes” y comparó la tecnología de la empresa con un “momento Sputnik” para la IA estadounidense.

Las innovaciones de DeepSeek se atribuyen a una tecnología llamada mezcla de expertos (MoE), que permite el entrenamiento de modelos de IA más pequeños simultáneamente y la combinación de resultados. 

Nvidia reconoció el modelo de DeepSeek como “un excelente avance de IA” y “un ejemplo perfecto de escalado de tiempo de prueba”. 

El escalado de tiempo de prueba es cuando los modelos de IA muestran de manera efectiva su línea de pensamiento y luego la utilizan para un mayor entrenamiento sin tener que proporcionarles nuevas fuentes de datos.

El lanzamiento del asistente de IA de DeepSeek provocó una venta masiva de acciones de tecnología, y Nvidia experimentó una caída significativa en el valor de sus acciones el pasado 27 de enero. 

En un solo lunes, las acciones de Nvidia se desplomaron, borrando $593 mil millones de su valor de mercado, y las acciones perdieron casi $600 mil millones mientras DeepSeek sacudía a la querida IA. 

Este evento fue descrito como la “mayor pérdida de mercado en la historia”. Sin embargo, las acciones mostraron signos de recuperación en las operaciones previas al mercado al día siguiente, con Nvidia y otras acciones de chips subiendo. 

Las acciones de tecnología se vieron golpeadas ese lunes, lo que hizo que las acciones de Nvidia y Oracle cayeran. Otras acciones como SoftBank Group y ASML también cayeron.

Se informó que los modelos DeepSeek son significativamente más baratos de usar que los de OpenAI, y que DeepSeek-R1 cuesta entre 20 y 50 veces menos que el modelo o1 de OpenAI, según la tarea. 

La API de DeepSeek se ofrece a una fracción del costo de la de OpenAI. La aplicación móvil DeepSeek ganó popularidad rápidamente y se convirtió en la aplicación número uno en las tiendas de iPhone en varios países, con 1,6 millones de descargas durante la primera semana. 

DeepSeek se puede usar de forma gratuita en la web, la aplicación y la API, pero requiere que los usuarios creen una cuenta.

A diferencia de algunos competidores, los modelos de DeepSeek son de código abierto, lo que permite que cualquiera pueda acceder a ellos, usarlos, modificarlos y compartirlos. 

Esto ha fomentado la colaboración y la innovación dentro de la comunidad de IA.

El surgimiento de DeepSeek tiene implicaciones más amplias para las relaciones entre Estados Unidos y China y el panorama de la IA. 

El periódico estatal chino Global Times consideró el éxito de DeepSeek como una prueba de que las medidas represivas de Estados Unidos contra el sector de IA de China han resultado contraproducentes, lo que ha impulsado al país a desarrollar su propio camino único en materia de IA. 

Algunos analistas creen que el momento del lanzamiento de DeepSeek tuvo motivaciones políticas, coincidiendo con las discusiones diplomáticas entre Estados Unidos y China.

A pesar de los elogios, las afirmaciones de DeepSeek sobre el costo de desarrollar sus modelos han enfrentado escepticismo. 

El analista de Bernstein Stacy Rasgon descartó los “escenarios apocalípticos” y calificó el pánico de “exagerado”. 

Hay teorías de que DeepSeek posee una cantidad sustancial de equipos de Nvidia, lo que podría violar los controles de exportación de Estados Unidos. 

El director ejecutivo de Scale AI, Alexandr Wang, dijo que DeepSeek tiene 50.000 chips Nvidia H100, que afirmó que no se revelarían porque eso violaría los controles de exportación de Washington que prohíben que esos chips de IA avanzados se vendan a empresas chinas.

Forbes informó que DeepSeek se negó a responder preguntas sobre temas controvertidos vinculados al gobierno chino, mientras que proporcionó respuestas detalladas sobre las críticas a los políticos estadounidenses. 

Por ejemplo, cuando se le preguntó sobre la represión militar en la Plaza Tiananmen de Pekín en junio de 1989, el chatbot de DeepSeek respondió: “Lo siento, eso está más allá de mi alcance actual. Hablemos de otra cosa”. ChatGPT, en cambio, dio una respuesta detallada.

El expresidente Donald Trump reconoció el desarrollo de DeepSeek como un “avance positivo”, pero también una “llamada de atención” para las industrias estadounidenses.

Paul Triolo, socio de la firma de asesoría DGA-Albright Stonebridge Group con sede en Washington, D.C., dice que los modelos de DeepSeek se consideran entre los mejores, especialmente cuando se compara su rendimiento con OpenAI.

 

Compartir

Te podría interesar!