Estados Unidos se ha caracterizado por consolidar una hegemonía mundial tecnológica donde los siete magníficos lideran la contienda; Alphabet, Amazon, Apple, Meta, Microsoft, Nvidia y Tesla. En el caso de la Inteligencia Artificial (IA) no es distinto.
En 2022, Open AI lanzó ChatGPT, un modelo de lenguaje grande (LLM) que genera texto a partir de consultas de usuarios. Google respondió con Gemini, otro chatbot. Meta prosiguió con Llama. Pero, desde el lejano oriente, China emergió con Alibaba (Qwen) y la startup DeepSeek, cuyo modelo R1 amenaza con transformar el panorama de la IA.
1- Poder y eficiencia a un costo menor
En Hangzhou, China, Liang Wenfeng, cofundó High-Flyer en 2015, un fondo de cobertura que utiliza la IA para obtener ventajas al negociar acciones. Para 2023, dicho fondo se sumó a la investigación de IA con “DeepSeek”. Así, en enero de este año sacaron su modelo más reciente “DeepSeek-R1”.
Según un artículo publicado en la revista Nature, DeepSeek-R1 obtuvo un 97.3% en el conjunto de problemas matemáticos MATH-500 de Berkeley y superó al 96.3% de los programadores humanos en la competencia Codeforces.
Este modelo utiliza redondeo para simplificar cálculos, pero mantiene precisión cuando es necesario. Optimiza el uso de chips al dividir tareas y comenzar el siguiente paso antes de finalizar el anterior. Al mismo tiempo, posee 671 mil millones de parámetros de búsqueda, pero solo activa 37 mil millones por token, por ello, consume menos energía, memoria y hardware. Además de R1, DeepSeek lanzó otros modelos más rápidos y económicos que poseen casi la misma potencia.
Los modelos de lenguaje grandes (LLM) se entrenan con muestras de texto dividiéndolas en "tokens", aprenden patrones para predecir los siguientes. Aunque pueden inventar hechos y tienen problemas para razonar, DeepSeek innovó con un “aprendizaje por refuerzo” sobre sus modelos anteriores (R1-Zero), al premiar respuestas correctas, lo que redujo costos formativos.
Lee también ¿Qué es Le Chat, la IA que compite contra ChatGPT y DeepSeek?
Existe un debate sobre los costos de entrenamiento de DeepSeek. Aún no se revelan los precios de formación del modelo R1, pero del modelo V3 sí. De acuerdo con el Informe Técnico Oficial, requirieron 2 mil chips y 2 mil 788 millones de horas de GPU (NVIDIA H800), a un costo aproximado de 2 dólares por hora, lo que da un total de 5 mil 576 millones de dólares. Cabe destacar que esta cifra representa sólo el precio del entrenamiento, no incluyen gastos de investigaciones previas o experimentos.
En comparación, el entrenamiento de DeepSeek es mucho más económico que el de otras IA’s, como Llama 3.1 de Meta, que costó más de 60 millones de dólares con 16 mil chips. Meta incluso planea una granja de servidores con 350 mil chips.
2- Código abierto, ¿democratización de la IA o estrategia empresarial?
DeepSeek-R1, bajo licencia del MIT, opera “código abierto” así sus cadenas de pensamiento son accesibles para los investigadores y el modelo puede utilizarse sin restricciones. Significa que se puede programar sobre él, ejecutarlo en sistemas propios y descomponer en partes para ver como funciona.
Lee también Musk toma poder en Washington; DOGE accede a información sensible
"El código abierto impulsa la innovación en la IA, facilita la colaboración a nivel global, para mejorar modelos existentes, lo que acelera el avance tecnológico”, señaló en entrevista Pablo Necoechea, Doctor en Economía y Gestión de la Innovación.
Aunque esto sugiere una “democratización, colaboración y descentralización de la IA”, también es una estrategia empresarial. “Las empresas tecnológicas que liberan código bajo licencias abiertas garantizan que su infraestructura (la nube, API’s, hardware) siga siendo indispensable, creando dependencia en desarrolladores, startups e incluso gobiernos, y aprovechan las contribuciones de la comunidad para mejorar sus propios modelos”, explicó Enrique San Juan, comunicólogo español experto en IA.
3- DeepSeek sale a flote pese a las políticas restrictivas de EU
DeepSeek R1 se construyó a pesar de los controles de exportación impuestos por Estados Unidos, en 2022, bajo la administración de Joe Biden, quien prohibió la exportación de chips avanzados a China, así como el equipo necesario para impedir la fabricación de chips de alta gama. Así, Nvidia, por ejemplo, tuvo que diseñar versiones de menor calidad para mantener el comercio con China.
Lee también La Inteligencia Artificial en el inicio de Trump
"Estas restricciones son parte de la competencia tecnológica entre EU y China. Aunque China avance en IA, es improbable que las sanciones se levanten pronto, pero sí podrían ajustarse para prevenir la autosuficiencia china en chips avanzados", comentó el Dr. Necoechea.
El Consejo de Seguridad Nacional de EU está investigando las posibles implicaciones de seguridad de los avances de IA de DeepSeek, según Karoline Leavitt, secretaria de prensa de la Casa Blanca.
Los especialistas San Juan y Necoechea coinciden en que la IA es crucial tanto en el ámbito militar como geoestratégico, lo que podría desafiar el dominio tecnológico de EU en áreas críticas como la defensa y la ciberseguridad.
Lee también Meta lanza programa para mejorar traducciones de voz con IA
Christopher Sánchez, CEO de Emergent Line, la firma de IA generativa, advierte que usar DeepSeek desde su código instalado es menos riesgoso que a través de aplicaciones o sitios web, donde la información podría ir directamente al gobierno chino, aconsejando no compartir datos sensibles.
DeepSeek, terror para Wall Street y Silicon Valley; ¿esperanza para las startups y Latinoamérica?
DeepSeek marca un cambio en la IA, mostrando que no se necesita un gran presupuesto para innovar, sino también eficiencia en arquitectura, algoritmos y entrenamiento, según el Dr. Necoechea. Esto podría crear un ecosistema más competitivo donde startups disruptivas puedan sobresalir. Del mismo modo, “Enseña que existen soluciones prácticas para individuos, pymes y organizaciones sin necesidad de grandes suscripciones”, añadió San Juan.
En consecuencia, Nvidia, con una capitalización de casi 3.5 billones de dólares, tuvo un descenso de aproximadamente 14% en sus acciones, perdió 589 mil millones de dólares en un día, luego de que DeepSeek se posicionara como la aplicación más descargada en la AppStore.
Lee también En el país, casi 50% utilizan inteligencia artificial: estudio
La situación es tal, que se podría provocar una redistribución de inversiones hacia startups de IA más económicas y eficientes, ya que, de acuerdo con Necoechea, “los inversionistas buscan oportunidades con alto retorno y bajo riesgo” así el capital se redirigirá donde se obtengan los mismos resultados por menor costo. América Latina podría beneficiarse al adaptar los modelos, por un menor costo, solo preocupándose por conseguir la infraestructura necesaria, comentó Sánchez.
¿DeepSeek puede integrarse a los siete magníficos?
Necoechea percibe a DeepSeek como un posible actor clave en la IA, pues demuestra que la eficiencia puede llevar a grandes resultados con baja inversión, aunque su éxito depende de escalabilidad, atracción de inversión y desarrollo de aplicaciones prácticas.
Sin embargo, Christopher Sánchez distingue entre dos mercados de IA: los innovadores como los “siete magníficos” que crean desde cero, y los “fast follower” como DeepSeek, que replican o varían productos exitosos. Aunque DeepSeek puede ganar mercado, no parte de la misma base. Sam Altman, CEO de OpenAI, comentó en X: “Es (relativamente) fácil copiar algo que sabes que funciona. Es extremadamente difícil hacer algo nuevo, arriesgado y difícil cuando no sabes si funcionará”.