¿Qué es Deepseek? La nueva IA de China ahora es de código abierto

Publicado: 2025-01-28

Deepseek es la última IA multimodal.

Técnicamente, Deepseek es el nombre de la compañía china que libera los modelos. Los modelos actuales en sí se llaman "R1" y "V1". Ambos están sacudiendo masivamente a toda la industria de IA después del lanzamiento del 20 de enero de R1 en los Estados Unidos.

¿Por qué? Viene con costos de desarrollo muy bajos, es de código abierto para uso comercial y socava a rivales como OpenAI , justo en el momento en que el gobierno de los Estados Unidos ha apostado más que nunca en sus propios avances en la IA costosa .

¿Qué necesito saber sobre Deepseek?

Deepseek ofrece un par de modelos diferentes, R1 y V3, además de un generador de imágenes. Lo clave a saber es que son más baratos, más eficientes y más libremente disponibles que los principales competidores, lo que significa que el chatgpt de OpenAI puede haber perdido su corona como la abeja reina de los modelos de IA.

Esto es lo que debe saber sobre todos ellos.

Deepseek r1

El modelo Deepseek que todos están usando en este momento es R1.

Acerca de Tech.co Video Miniatura que muestra al escritor principal Conor Cawley sonriendo junto al logotipo de Tech.co Esto solo adentro! Vista
Las principales ofertas de tecnología empresarial para 2025 👨‍💻
Ver el botón Lista

Está en la parte superior de la App Store , venciendo a ChatGPT, y es la versión que actualmente está disponible en la web y de código abierto, con una API disponible gratuitamente. A diferencia de otros modelos con sede en China con el objetivo de competir con CHATGPT, los expertos de IA están impresionados con la capacidad que ofrece R1.

Como el influyente inversor tecnológico Marc Andreessen lo expresó hace unos días: "Deepseek R1 es uno de los avances más sorprendentes e impresionantes que he visto, y como código abierto, un profundo regalo para el mundo".

Es mucho más barato de operar que ChatGPT, posiblemente de 20 a 50 veces más barato.

Hay cierta oscuridad en torno al tipo de chip utilizado para entrenar a los modelos de Deepseek, con algunas afirmaciones sin fundamento que indican que la compañía usó chips A100, que actualmente están prohibidos de la exportación estadounidense a China.

Deepseek v3

Sin embargo, el otro gran modelo de la compañía es lo que asusta a Silicon Valley: Deepseek V3.

El modelo V3 era barato de entrenar, mucho más barato de lo que muchos expertos en IA habían creído posible: según Deepseek, la capacitación tomó solo 2,788 mil horas de GPU H800, lo que suma solo $ 5.576 millones , suponiendo un costo de $ 2 por GPU por hora.

V3 es un modelo más eficiente, ya que opera en una arquitectura MOE de 671b-paraméter con 37b de parámetros activados por token, reduciendo la sobrecarga computacional requerida por ChatGPT y su diseño de 1.8T-Parameter .

Generación de texto a imagen: Janus Pro

Además, está Janus Pro , el generador de texto a imagen de la compañía.

Deepseek ha informado que su modelo Janus-Pro-7B AI ha superado a Dall-E 3 de OpenAI y la difusión estable de la IA de estabilidad , según una clasificación de la clasificación para la generación de imágenes utilizando indicaciones de texto.

Según la compañía, este modelo fue capacitado en "72 millones de imágenes sintéticas de alta calidad".

Deepseek puede correr localmente

Una última cosa que debe saber: Deepseek se puede ejecutar localmente , sin necesidad de una conexión a Internet. Esto es parte integrante de la versión de código abierto del modelo: dado que el código está disponible en GitHub, se puede descargar.

Eso marca otra mejora sobre los modelos de IA populares como OpenAI y, al menos para aquellos que optaron por ejecutar la IA localmente, significa que no hay posibilidad de que la compañía con sede en China acceda a los datos de los usuarios.

En respuesta, el stock de Nvidia está muy abajo

Deepseek marca una gran sacudida para el enfoque popular de la tecnología de IA en los Estados Unidos: los modelos de IA de la compañía china se construyeron con una fracción de los recursos, pero entregaron los productos y son de código abierto, para arrancar. La respuesta inicial fue una gran caída en los precios de las acciones para las compañías de IA más grandes con sede en EE. UU.

AI chip company NVIDIA saw the biggest stock drop in its history, losing nearly $600 billion in stock-market value when stocks dropped 16.86% in response to the DeepSeek news.

¿Qué tan malo es eso? Bueno, es más del doble que cualquier otra empresa estadounidense que haya caído en solo un día . En otras palabras, no es genial.

La respuesta de la compañía hasta ahora: se admite que el modelo R1 de Deepseek es "un excelente avance de la IA".

Otras acciones de EE. UU. También están bajas

Las acciones también cayeron en otros fabricantes de chips, como la compañía holandesa ASML, mientras que el S&P 500 cayó más del 2% y Nasdaq cayó un 3,5%.

Muchos expertos predicen que la volatilidad del mercado de valores se establecerá pronto. Sin embargo, podría marcar el final de una era para la tendencia ascendente constante para compañías como Nvidia, que había visto un crecimiento increíblemente alto desde principios de 2023.

Pero esta es una buena noticia para algunos gigantes tecnológicos

Entonces, ¿cómo cambia el paisaje de IA si Deepseek es el próximo modelo de Estados Unidos en Estados Unidos?

Es probable que Meta sea un gran ganador aquí: la compañía necesita modelos de IA baratos para tener éxito, y ahora el próximo avance de ahorro de dinero está aquí.

Microsoft también ahorrará dinero en centros de datos, mientras que Amazon puede aprovechar los modelos de código abierto recientemente disponibles.

Google, por otro lado, habría resistido a ganar la mayor cantidad de dinero de todos esos centros de datos. Sin embargo, algo nos dice que el gigante tecnológico masivo se mantendrá a flote. A la larga, la IA de código abierto barata sigue siendo buena para las empresas tecnológicas en general, incluso si podría no ser excelente para los EE. UU. En general.

¿Cómo tiene en cuenta el programa Stargate de $ 500 mil millones de EE. UU.?

La interrupción de Deepseek se produce solo unos días después de un gran anuncio del presidente Trump: el gobierno de los Estados Unidos hundirá $ 500 mil millones en "Stargate", una empresa conjunta de IA con Operai, Softbank y Oracle que apunta a solidificar a los Estados Unidos como líder mundial en ai.

Entre los planes de la iniciativa se encuentran la construcción de 20 centros de datos en los Estados Unidos , así como la creación de "cientos de miles" de empleos, aunque el último reclamo parece dudoso, basado en el resultado de afirmaciones anteriores similares .

Con esa inversión llamativa, el gobierno de los Estados Unidos ciertamente parece estar arrojando su peso detrás de una estrategia de exceso: verter miles de millones para resolver sus problemas de IA, bajo el supuesto de que pagar más que cualquier otro país entregará una mejor IA que cualquier otro país.

Ahora, Deepseek ha surgido para hacer un agujero en esa tesis. Si Deepseek puede obtener los mismos resultados en menos de una décima parte del presupuesto de desarrollo, todos esos miles de millones no parecen una apuesta tan segura.

El mercado de valores, por ahora, al menos, parece estar de acuerdo.