1. La sorpresa

DeepSeek es una firma de tecnología avanzada que se dedicada a desarrollar modelos de lenguajes de gran tamaño —Large Language Models (LLM)— de código abierto.

Durante la semana en curso, la referida firma alcanzó gran notoriedad mundial por haber desafiado el liderazgo estadounidense en el desarrollo de la inteligencia artificial generativa (IAG).

DeepSeek tiene su sede en la ciudad de Hangzhou, capital de la provincia de Zhejiang, en la República Popular China. Fue fundada en 2023 y es propiedad de Liang Wenfen, quien cuenta con 39 años de edad, y podría ser considerado como el “Sam Altman” en la industria china dedicada al desarrollo de la inteligencia artificial.

En diciembre de 2024 DeepSeek liberó el modelo DeepSeek V3, el cual llamó la atención de algunos especialistas, quienes advirtieron que el referido modelo trabajaba de forma más eficiente, económica y con más exactitud frente a modelos cuyo desarrollo ha resultado costoso, y que podrían ser considerados más robustos, como Llama 3.1 de Meta, por ejemplo.

El 10 de enero de 2025, a través de la plataforma Hugging Face, DeepSeek introdujo DeepSeek-R1, su primera aplicación de chatbot gratuita para Android y iOS.

A los pocos días, el referido modelo, compuesto por 671 mil millones de parámetros, se colocó entre los más solicitados, superando a Llama 3.1 de Meta así como a Qwen de Alibaba.

DeepSeek ha demostrado ser capaz de ejecutar grandes cargas de trabajo de forma eficiente, sin perder precisión y con pocos parámetros seleccionados. Además, sus algoritmos, modelos y detalles de entrenamiento son de código abierto.

El 27 de enero DeepSeek-R1 logró superar a ChatGPT como la aplicación gratuita más descargada en la App Store de iOS en Estados Unidos.

Ese hecho seguramente hirió la vanidad del gobierno estadounidense y, por supuesto, también irritó a los poderosos , sacudiendo a su paso a los mercados financieros.

Las acciones de los principales proveedores de chips resintieron los efectos de la turbulencia generada por la exitosa firma china.

Las acciones de Nvidia, por ejemplo, registraron una abrupta depreciación, estimada en 18 por ciento, aunque en menos de 24 horas consiguieron recuperar 9 por ciento del valor inicial.

El formidable despliegue de DeepSeek demostró que las medidas impuestas por Estados Unidos, para contener y obstruir el avance de China en materia de Inteligencia Artificial, —como las restricciones en el acceso a los chips, por ejemplo—, no precisamente han conseguido frenar o mermar la capacidad competitiva de China.

La ingeniería —se afirma— se suele basar en las limitaciones, y las restricciones impuestas a China contribuyeron a estimular la innovación y la creatividad en su élite científica y tecnológica.

DeepSeek ha mostrado que tal vez no sea necesario realizar inversiones multimillonarias en chips, como lo han hecho algunas de las grandes compañías estadounidenses para el desarrollo y entrenamiento de sus respectivos modelos de IAG.

Para el desarrollo y entrenamiento de GPT-4, de OpenAI, por ejemplo, se estima que en 2023 fue necesario invertir más de 100 millones de dólares. En cambio, el entrenamiento de DeepSeek representó una inversión de 6 millones de dólares en 2024. La diferencia es considerable.

Desde la arrogante perspectiva del gobierno y de las gigantes tecnológicas estadounidenses, la originalidad les pertenece a ellos, a China corresponde solo una formidable capacidad de imitación, generalmente deficiente. La introducción y el éxito de DeepSeek definitivamente les sorprendió.

El lunes 26 de enero, de acuerdo con Reuters, Donald Trump señaló que si la industria china podía crear una tecnología de IA más barata, las empresas estadounidenses la seguirían (…). Podría ser un avance muy positivo. Así que en lugar de gastar miles y miles de millones, gastarás menos y, con suerte, encontrarás la misma solución”.

Las palabras del temperamental presidente de Estados Unidos podrían ser interpretadas como una advertencia a los barones de la tecnología, a quienes supone como sus firmes aliados ante la sostenida expansión comercial de China.

Los barones de la tecnología demandan considerables presupuestos, permisos, condonaciones, privilegios. Trump es pragmático, exige resultados.

2. La negación

De acuerdo con Bloomberg, firmas como Microsoft y OpenAI han señalado que un grupo vinculado a DeepSeek consiguió obtener datos fundamentales de sus modelos, de manera no autorizada.

Investigadores dedicados a temas de seguridad en Microsoft —señala Bloomberg—, afirmaron haber identificado que la filtración fue realizada a través de la interfaz de programación de aplicaciones (API) de OpenAI.

A través de su vocera, la Casa Blanca informó que se encuentra analizando las implicaciones que tendría DeepSeek en la seguridad nacional. Karoline Leavitt, responsable de prensa culpó a la administración del presidente Biden: “la última administración se cruzó de brazos y permitió que China desarrollara rápidamente este programa de IA”.

Ante el éxito de DeepSeek, David Sacks, el zar de IA del presidente Trump, afirmó a Fox News que "es posible" que se hubiera producido un robo de propiedad intelectual.

"Existe evidencia sustancial de que lo que DeepSeek hizo aquí fue destilar el conocimiento de los modelos de OpenAI y no creo que OpenAI esté muy contento con esto".

Al interior de OpenAI también se maneja la tesis relativa a la “destilación”.

La visión de Sam Altman parece ser diferente. El CEO de OpenAI dispone de una perspectiva panorámica. Entiende que, con la irrupción de DeepSeek, el entorno de la IAG ha cambiado, e incluso reconoce las cualidades del nuevo competidor:

“El r1 de DeepSeek es un modelo impresionante, sobre todo teniendo en cuenta lo que ofrece por el precio. Obviamente, ofreceremos modelos mucho mejores y, además, ¡es estimulante tener un nuevo competidor! Sacaremos algunos lanzamientos”.

3. El desafío

El éxito de DeepSeek ha generado dudas entre los inversionistas sobre la eficiencia de determinadas compañías diseñadoras de chips, como Nvidia, AMD y Broadcom, las cuales han multiplicado sus ganancias a partir de la demanda de cómputo generada por el formidable despliegue de la inteligencia artificial.

Cada nueva generación de LLM demanda mayores capacidades de procesamiento, situación que, naturalmente favorece los intereses de los fabricantes de chips.

Sin embargo, DeepSeek ha demostrado que es posible desarrollar un estupendo modelo de IAG sin considerables inversiones, y sin chips de última generación.

DeepSeek además confirma que, en materia de IAG, China no se encuentra tan atrás de Estados Unidos, como estimaba, con ingenuo optimismo el gobierno estadounidense.

Para el gobierno estadounidense el asunto es delicado. DeepSeek podría estimular el interés en ciertas naciones por adoptar las atractivas opciones que ofrece la IAG china, especialmente si consideramos los menores costos que ésta representa.

La ley de los rendimientos acelerados, formulada por Ray Kurzweil, establece que en cada una de las etapas del proceso evolutivo de una tecnología sirve para generar la siguiente etapa mediante una retroalimentación positiva.

Desde esta perspectiva, la introducción del formidable modelo de DeepSeek, el cual es considerado por algunos expertos como una increíble obra de ingeniería, representa una puntual e importante contribución al desarrollo de la inteligencia artificial generativa, en la cual, por supuesto, Estados Unidos no ha dicho la última palabra.

Google News

TEMAS RELACIONADOS