Co to jest Deepseek? Nowa sztuczna inteligencja Chin jest teraz open source

Opublikowany: 2025-01-28

Deepseek to najnowsza multimodalna sztuczna inteligencja.

Technicznie Deepseek to nazwa chińskiej firmy wypuszczającej modele. Same obecne modele nazywane są „R1” i „V1”. Obaj masowo wstrząsają całą branżą AI po wydaniu R1 20 stycznia w USA.

Dlaczego? Ma bardzo niskie koszty rozwoju, jest otwarty do użytku komercyjnego i podcina rywale, takie jak Openai -w czasie, gdy rząd USA stawia bardziej niż kiedykolwiek w ramach własnych domowych postępów AI .

Co muszę wiedzieć o Deepseek?

Deepseek oferuje kilka różnych modeli - R1 i V3 - oprócz generatora obrazu. Kluczową rzeczą, o której warto wiedzieć, jest to, że są tańsze, wydajniejsze i bardziej dostępne niż najlepsi konkurenci, co oznacza, że chatgpt Openai mógł stracić koronę jako modele Queen Bee of AI.

Oto, co o nich wiedzieć.

Deepseek R1

Model Deepseek, którego teraz wszyscy używają, to R1.

Informacje o Miniaturze wideo z technologią pokazującą głównego pisarza Conora Cawleya uśmiechającego się obok logo Tech.co To właśnie w! Pogląd
Najlepsze oferty technologii biznesowej na 2025 👨‍💻
Zobacz przycisk listy

Jest na szczycie App Store -pokonując Chatgpt-i jest to wersja, która jest obecnie dostępna w Internecie i open source, z swobodnie dostępnym interfejsem API. W przeciwieństwie do niektórych innych chińskich modeli mających na celu konkurowanie z Chatgpt, eksperci AI są pod wrażeniem możliwości oferowanej przez R1.

Jako wpływowy inwestor technologii Marc Andreessen położył go kilka dni temu: „Deepseek R1 jest jednym z najbardziej niesamowitych i imponujących przełomów, jakie kiedykolwiek widziałem - i jako open source, głęboki prezent dla świata”.

Jest to znacznie tańsze działanie niż Chatgpt: być może 20 do 50 razy tańszy.

Istnieje pewna mrowienie wokół rodzaju chipu używanego do szkolenia modeli Deepseek, a niektóre bezpodstawne twierdzenia stwierdzają, że firma stosowała układy A100, które są obecnie zakazane z eksportu USA do Chin.

Deepseek v3

Jednak innym dużym modelem firmy jest przerażająca Dolina Krzemowa: Deepseek V3.

Model V3 był tani do trenowania, o wiele tańszy niż wielu ekspertów AI uważało za możliwe: według Deepseek trening zajęł zaledwie 2 788 tys. GPU H800, co stanowi zaledwie 5,576 miliona dolarów , zakładając 2 USD za GPU za godzinę.

V3 jest bardziej wydajnym modelem, ponieważ działa na 671b-parametrowej architekturze MOE z parametrami aktywowanymi 37b na token-ograniczenie kosztów obliczeniowych wymaganych przez Chatgpt i jego konstrukcję parametrów 1,8T .

Generowanie tekstu do obrazu: Janus Pro

Ponadto jest Janus Pro , generator tekstu do obrazu.

Deepseek poinformował, że jego model AI Janus-Pro-7B przewyższył Dall-E 3 Openai i stabilną dyfuzję AI , zgodnie z rankingiem tablicy liderów dla generowania obrazów za pomocą podpowiedzi tekstowych.

Według firmy model ten został przeszkolony na temat „72 milionów wysokiej jakości obrazów syntetycznych”.

Deepseek może działać lokalnie

Ostatnią rzeczą, którą należy wiedzieć: Deepseek może być uruchamiany lokalnie , bez potrzeby połączenia internetowego. Jest to część i paczka z wydaniem open source modelu: Ponieważ kod jest dostępny w GitHub, można go pobrać.

Oznacza to kolejną poprawę w stosunku do popularnych modeli AI, takich jak Openai i-przynajmniej dla tych, którzy zdecydowali się uruchomić AI lokalnie-oznacza to, że nie ma możliwości, aby chińska firma uzyskuje dostęp do danych użytkownika.

W odpowiedzi zapasy Nvidii są znacznie w dół

Deepseek oznacza duży wstrząs w popularnym podejściu do AI Tech w USA: modele AI chińskiej firmy zostały zbudowane z ułamkiem zasobów, ale dostarczały towary i są open source. Początkowa odpowiedź była dużym spadkiem cen akcji dla największych amerykańskich firm AI.

AI Chip Company Nvidia odnotowała największy spadek akcji w swojej historii, tracąc prawie 600 miliardów dolarów wartości rynkowej, gdy akcje spadły o 16,86% w odpowiedzi na Deepseek News.

Jak źle to jest? Cóż, to ponad dwa razy więcej niż każda inna firma amerykańska, która kiedykolwiek spadła w ciągu jednego dnia . Innymi słowy, to nie jest świetne.

Dotychczasowa odpowiedź firmy: przyznano, że model R1 Deepseek jest „doskonałym awansem AI”.

Inne udziały w USA też spadły

Akcje spadły również do innych producentów wiewiórków, takich jak holenderska firma ASML, podczas gdy S&P 500 spadł o ponad 2%, a NASDAQ spadł o 3,5%.

Wielu ekspertów przewiduje, że zmienność giełdowa wkrótce się uspokoi. Może to jednak zaznaczyć koniec epoki stałego stromego trendu w górę dla firm takich jak Nvidia, które odnotowały niezwykle wysoki wzrost od początku 2023 r.

Ale to dobra wiadomość dla niektórych gigantów technologicznych

Jak zmienia się krajobraz AI, jeśli Deepseek jest następnym najlepszym modelem Ameryki?

Meta jest prawdopodobnie dużym zwycięzcą: firma potrzebuje tanich modeli AI, aby odnieść sukces, a teraz następny postęp oszczędzania pieniędzy jest tutaj.

Microsoft będzie również oszczędzać pieniądze na centrach danych, podczas gdy Amazon może skorzystać z nowo dostępnych modeli open source.

Z drugiej strony Google stałby się jak najwięcej pieniędzy ze wszystkich tych centrów danych. Coś nam mówi, że ogromny gigant technologiczny pozostanie na powierzchni. Na dłuższą metę tanie AI open source jest nadal dobre dla firm technologicznych w ogóle, nawet jeśli może nie być świetna dla Stanów Zjednoczonych.

W jaki sposób program programu Stargate w wysokości 500 miliardów dolarów w wysokości 500 miliardów dolarów?

Zakłócenie Deepeek pojawia się zaledwie kilka dni po wielkim ogłoszeniu prezydenta Trumpa: rząd USA zatopi 500 miliardów dolarów w „Stargate”, wspólne przedsięwzięcie AI z Openai, SoftBank i Oracle, które mają na celu utrwalanie USA jako światowego przywódcy przywódcy w AI.

Wśród planów inicjatywy jest budowa 20 centrów danych w USA , a także tworzenie „setek tysięcy” miejsc pracy, chociaż to ostatnie twierdzenie wydaje się wątpliwe, w oparciu o wynik podobnych wcześniejszych roszczeń .

Przy tej wznośnej inwestycji rząd USA z pewnością rzuca swoją wagę za strategią nadwyżki: wlewanie miliardów do rozwiązania problemów z sztucznej inteligencji, przy założeniu, że płacenie więcej niż jakikolwiek inny kraj dostarczy lepszą sztuczną inteligencję niż jakikolwiek inny kraj.

Teraz Deepseek pojawił się, aby szturchać dziurę w tej pracy. Jeśli Deepseek może uzyskać takie same wyniki na mniej niż jednej dziesiątej budżetu rozwojowego, wszystkie te miliardy nie wyglądają tak pewnie.

Rynek akcji - przynajmniej na razie - wydaje się zgadzać.