Qu'est-ce que Deepseek? La nouvelle IA de la Chine est désormais open-source
Publié: 2025-01-28Deepseek est la dernière IA multimodale.
Techniquement, Deepseek est le nom de la société chinoise qui publie les modèles. Les modèles actuels eux-mêmes sont appelés «R1» et «V1». Les deux secouent massivement toute l'industrie de l'IA après la sortie de R1 le 20 janvier aux États-Unis.
Pourquoi? Il est livré avec des coûts de développement très bas, il est open-source pour une utilisation commerciale, et il sape ses rivaux comme Openai - à un moment où le gouvernement américain a parié plus que jamais sur ses propres avancées d'IA .
Que dois-je savoir sur Deepseek?
Deepseek propose quelques modèles différents - R1 et V3 - en plus d'un générateur d'images. L'essentiel à savoir est qu'ils sont moins chers, plus efficaces et plus disponibles librement que les meilleurs concurrents, ce qui signifie que le chatppt d'Openai a peut-être perdu sa couronne en tant que reine des modèles d'IA.
Voici ce qu'il faut savoir de tous.
Deepseek R1
Le modèle Deepseek que tout le monde utilise actuellement est R1.
C'est juste dedans! Voir
les meilleures offres de technologie commerciale pour 2025 👨💻
C'est en haut de l'App Store - battant Chatgpt - et c'est la version qui est actuellement disponible sur le Web et l'Open-source, avec une API disponible librement. Contrairement à certains autres modèles basés en Chine visant à rivaliser avec Chatgpt, les experts de l'IA sont impressionnés par la capacité d'offre R1.
Comme l'a dit l'investisseur technologique influent Marc Andreessen en arrière: «Deepseek R1 est l'une des percées les plus étonnantes et les plus impressionnantes que j'ai jamais vues - et en tant qu'open source, un cadeau profond pour le monde.»
C'est beaucoup moins cher à fonctionner que Chatgpt: peut-être 20 à 50 fois moins cher.
Il y a une certaine trouble entourant le type de puce utilisé pour former les modèles de Deepseek, avec des affirmations non fondées indiquant que la société a utilisé des puces A100, qui sont actuellement interdites de l'exportation américaine vers la Chine.
Deepseek v3
Cependant, l'autre grand modèle de l'entreprise est ce qui effraye la Silicon Valley: Deepseek V3.
Le modèle V3 était bon marché pour s'entraîner, beaucoup moins cher que de nombreux experts de l'IA ne le pensaient possible: selon Deepseek, la formation n'a pris que 2 788 000 heures de GPU H800, ce qui ne représente que 5,576 millions de dollars , en supposant un coût de 2 $ par heure par heure.
Le V3 est un modèle plus efficace, car il fonctionne sur une architecture MOE de paramètre 671B avec des paramètres activés 37B par jeton - réduisant les frais généraux de calcul requis par Chatgpt et sa conception de paramètre de 1,8 t .

Génération de texte à l'image: Janus Pro
De plus, il y a Janus Pro , le générateur de texte à l'image de l'entreprise.
Deepseek a rapporté que son modèle Janus-Pro-7b AI avait surperformé l'Openai Dall-E 3 et la diffusion stable de Stabilité AI , selon un classement de classement pour la génération d'images à l'aide d'invites de texte.
Selon la société, ce modèle a été formé sur «72 millions d'images synthétiques de haute qualité».
Deepseek peut fonctionner localement
Une dernière chose à savoir: Deepseek peut être exécuté localement , sans avoir besoin de connexion Internet. Ceci fait partie intégrante de la version open source du modèle: Étant donné que le code est disponible sur github, il peut être téléchargé.
Cela marque une autre amélioration par rapport aux modèles d'IA populaires comme OpenAI, et - du moins pour ceux qui ont choisi d'exécuter l'IA localement - cela signifie qu'il n'y a aucune possibilité que l'entreprise basée en Chine accéde aux données des utilisateurs.
En réponse, le stock de Nvidia est bien en bas
Deepseek marque un grand remaniement de l'approche populaire de l'IA Tech aux États-Unis: les modèles d'IA de l'entreprise chinoise ont été construits avec une fraction des ressources, mais ont livré les marchandises et sont open-source, pour démarrer. La réponse initiale a été une forte baisse des cours des actions pour les plus grandes sociétés d'IA basées aux États-Unis.
La société AI Chip Nvidia a vu la plus grande baisse de ses actions de son histoire, perdant près de 600 milliards de dollars de valeur boursière lorsque les actions ont chuté de 16,86% en réponse à Deepseek News.
À quel point est-ce mauvais? Eh bien, c'est plus de deux fois plus que toute autre entreprise américaine unique n'a jamais chuté en une seule journée . En d'autres termes, ce n'est pas génial.
La réponse de l'entreprise jusqu'à présent: il a admis que le modèle R1 de Deepseek est «une excellente progression de l'IA».
D'autres actions américaines sont également en baisse
Les actions ont également chuté sur d'autres fabricants de puces, comme la société néerlandaise ASML, tandis que le S&P 500 a chuté de plus de 2% et le NASDAQ a chuté de 3,5%.
De nombreux experts prévoient que la volatilité boursière se réglera bientôt. Cependant, il pourrait marquer la fin d'une époque pour la tendance à la hausse raide constante pour des entreprises comme NVIDIA, qui a connu une croissance incroyablement élevée depuis le début de 2023.
Mais c'est une bonne nouvelle pour certains géants de la technologie
Alors, comment le paysage de l'IA change-t-il si Deepseek est le prochain Top Model de l'Amérique?
Meta est probablement un grand gagnant ici: l'entreprise a besoin de modèles d'IA bon marché afin de réussir, et maintenant la prochaine avancement d'économie d'argent est là.
Microsoft économisera également de l'argent sur les centres de données, tandis qu'Amazon peut profiter des modèles open source nouvellement disponibles.
Google, en revanche, aurait tenu de faire le meilleur parti de tous ces centres de données. Quelque chose nous dit que le géant massif de la technologie restera à flot, cependant. À long terme, l'IA open source bon marché est toujours bonne pour les entreprises technologiques en général, même si ce n'est pas génial pour l'ensemble des États-Unis.
Comment le programme de Stargate de 500 milliards de dollars des États-Unis est-il possible?
La perturbation Deepseek survient quelques jours seulement après une grande annonce du président Trump: le gouvernement américain plongera 500 milliards de dollars dans "Stargate", une entreprise conjointe d'IA avec Openai, Softbank et Oracle qui vise à consolider les États-Unis en tant que leader mondial en ai.
Parmi les plans de l'initiative figurent la construction de 20 centres de données à travers les États-Unis , ainsi que la création de «centaines de milliers» d'emplois, bien que cette dernière affirmation semble douteuse, sur la base de l'issue de revendications antérieures similaires .
Avec cet investissement alléchant, le gouvernement américain semble certainement jeter son poids derrière une stratégie d'excès: verser des milliards dans la résolution de ses problèmes d'IA, en supposant que payer plus que tout autre pays offrira une meilleure IA que tout autre pays.
Maintenant, Deepseek a émergé pour percer un trou dans cette thèse. Si Deepseek peut obtenir les mêmes résultats sur moins d'un dixième du budget de développement, tous ces milliards ne ressemblent pas à un pari si sûr.
Le marché boursier - pour l'instant, au moins - semble être d'accord.