Ce este Deepseek? Noua AI a Chinei este acum open-source
Publicat: 2025-01-28Deepseek este cea mai recentă AI multimodală.
Tehnic, Deepseek este numele companiei chineze care lansează modelele. Modelele actuale în sine sunt numite „R1” și „V1”. Ambele agită masiv întreaga industrie AI în urma lansării R1 din 20 ianuarie în SUA.
De ce? Este livrat cu costuri de dezvoltare foarte mici, este open-source pentru uz comercial și scade rivalii precum OpenAI -chiar într-un moment în care guvernul SUA a pariat mai mult decât oricând pe propriile progrese AI de origine .
Ce trebuie să știu despre Deepseek?
Deepseek oferă câteva modele diferite - R1 și V3 - pe lângă un generator de imagini. Lucrul esențial de știut este că sunt mai ieftine, mai eficiente și mai libere disponibile decât concurenții de top, ceea ce înseamnă că Chatgpt -ul lui OpenAI ar fi putut să -și fi pierdut coroana ca albina regină a modelelor AI.
Iată ce să știi despre toate.
Deepseek R1
Modelul Deepseek pe care toată lumea îl folosește în acest moment este R1.
Asta doar în! Vedere
Cele mai bune oferte de tehnologie de afaceri pentru 2025 👨💻
Este în partea de sus a App Store -învingând Chatgpt-și este versiunea care este disponibilă în prezent pe web și open-source, cu o API disponibilă liberă. Spre deosebire de alte modele bazate pe China, care urmăresc să concureze cu ChatGPT, experții AI sunt impresionați de capacitatea pe care o oferă R1.
După cum a spus investitorul de tehnologie influentă, Marc Andreessen, cu câteva zile în urmă: „Deepseek R1 este unul dintre cele mai uimitoare și impresionante descoperiri pe care le -am văzut vreodată - și ca open source, un cadou profund pentru lume.”
Este mult mai ieftin să funcționezi decât ChatGPT, de asemenea: posibil de 20 până la 50 de ori mai ieftin.
Există o oarecare murdărie care înconjoară tipul de cip folosit pentru a antrena modelele Deepseek, cu unele afirmații nefondate care afirmă că compania a folosit cipuri A100, care sunt interzise în prezent de la exportul american în China.
Deepseek V3
Cu toate acestea, celălalt mare model al companiei este ceea ce sperie Silicon Valley: Deepseek V3.
Modelul V3 a fost ieftin pentru a se antrena, mult mai ieftin decât mulți experți AI au crezut posibil: potrivit Deepseek, antrenamentul a durat doar 2.788 mii de ore GPU H800, ceea ce a adăugat doar 5,576 milioane dolari , presupunând un cost de 2 dolari pe GPU pe oră.

V3 este un model mai eficient, deoarece funcționează pe o arhitectură MoE de 671B-parametru , cu parametri activați de 37B pe jeton-reducând cheltuielile de calcul cerute de ChatGPT și designul său de 1,8 T-parametri .
Generarea text-la-imagine: Janus Pro
În plus, există Janus Pro , generatorul de text la imagine al companiei.
Deepseek a raportat că modelul său Janus-Pro-7B AI a depășit Dall-E 3 și Stabilitatea AI-ului de difuzie stabilă a AI , potrivit unui clasament de clasament pentru generarea de imagini folosind prompturi de text.
Potrivit companiei, acest model a fost instruit pe „72 de milioane de imagini sintetice de înaltă calitate”.
Deepseek poate rula local
Un ultim lucru de știut: Deepseek poate fi rulat la nivel local , fără a fi nevoie de o conexiune la internet. Aceasta face parte și un colet cu versiunea open-source a modelului: Deoarece codul este disponibil pe GitHub, acesta poate fi descărcat.
Aceasta marchează o altă îmbunătățire față de modelele AI populare precum OpenAI și-cel puțin pentru cei care au ales să ruleze AI-ul local-înseamnă că nu există posibilitatea ca compania din China să acceseze datele utilizatorilor.
Ca răspuns, stocul Nvidia este mult timp în jos
Deepseek marchează o mare agitare a abordării populare a tehnologiei AI din SUA: modelele AI ale companiei chineze au fost construite cu o fracțiune din resurse, dar au livrat mărfurile și sunt open-source, pentru a porni. Răspunsul inițial a fost o scădere mare a prețurilor acțiunilor pentru cele mai mari companii AI din SUA.
Compania AI Chip Nvidia a înregistrat cea mai mare scădere a stocurilor din istoria sa, pierzând aproape 600 de miliarde de dolari în valoare de piață de stoc atunci când stocurile au scăzut cu 16,86% ca răspuns la Știrile Deepseek.
Cât de rău este asta? Ei bine, este mai mult de două ori mai mult decât orice altă companie americană a scăzut vreodată într -o singură zi . Cu alte cuvinte, nu este grozav.
Răspunsul companiei de până acum: este recunoscut că modelul R1 Deepseek este „un avansă AI excelent”.
Alte acțiuni din SUA sunt de asemenea în scădere
Acțiunile au scăzut și la alți chipmatori, cum ar fi compania olandeză ASML, în timp ce S&P 500 a scăzut mai mult de 2%, iar NASDAQ a scăzut cu 3,5%.
Mulți experți prezic că volatilitatea pieței bursiere se va stabili în curând. Cu toate acestea, s -ar putea să marcheze sfârșitul unei epoci pentru tendința ascendentă constantă pentru companii precum Nvidia, care a înregistrat o creștere incredibil de mare de la începutul anului 2023.
Dar aceasta este o veste bună pentru unii giganți tehnologici
Deci, cum se schimbă peisajul AI dacă Deepseek este următorul model de top al Americii?
Meta este probabil un mare câștigător aici: compania are nevoie de modele AI ieftine pentru a avea succes, iar acum următoarea avansare de economisire a banilor este aici.
Microsoft va economisi, de asemenea, bani pe centrele de date, în timp ce Amazon poate profita de modelele open source nou disponibile.
Pe de altă parte, Google ar fi fost să câștige cei mai mulți bani din toate aceste centre de date. Ceva ne spune că gigantul tehnologic masiv va rămâne la linia de plutire. Pe termen lung, AI-ul open-source ieftin este încă bun pentru companiile tehnologice în general, chiar dacă s-ar putea să nu fie excelent pentru SUA în general.
Cum fac factorul programului Stargate de 500 de miliarde de dolari SUA?
Întreruperea profundă vine la doar câteva zile după un mare anunț din partea președintelui Trump: guvernul SUA va scufunda 500 de miliarde de dolari în „Stargate”, o asociere AI comună cu OpenAI, Softbank și Oracle, care are ca scop solidificarea SUA ca lider mondial în AI.
Printre planurile inițiativei se numără construcția a 20 de centre de date din SUA , precum și crearea de „sute de mii” de locuri de muncă, deși ultima afirmație pare dubioasă, pe baza rezultatului unor afirmații anterioare similare .
Cu această investiție cu ochi de ochi, guvernul SUA pare să-și arunce greutatea în spatele unei strategii de exces: turnarea miliardelor în rezolvarea problemelor sale de AI, sub presupunerea că plata mai mult decât oricare altă țară va livra AI mai bună decât orice altă țară.
Acum, Deepseek a apărut pentru a arunca o gaură în acea teză. Dacă Deepseek poate obține aceleași rezultate cu mai puțin de o zecime din bugetul de dezvoltare, toate aceste miliarde nu arată ca un astfel de pariu sigur.
Piața bursieră - cel puțin, cel puțin - pare să fie de acord.