Was ist Deepseek? Chinas neue KI ist jetzt Open-Source

Veröffentlicht: 2025-01-28

Deepseek ist die neueste multimodale KI.

Technisch gesehen ist Deepseek der Name des chinesischen Unternehmens, das die Modelle veröffentlicht. Die aktuellen Modelle selbst werden "R1" und "V1" bezeichnet. Beide schütteln die gesamte KI -Industrie nach R1 -Veröffentlichung von R1 in den USA massiv auf.

Warum? Es hat sehr niedrige Entwicklungskosten, es ist Open-Source für den kommerziellen Gebrauch und untergräbt Rivalen wie OpenAI -genau zu einer Zeit, als die US-Regierung stärker als je zuvor auf ihre eigenen KI-Fortschritte gebet hat.

Was muss ich über Deepseek wissen?

Deepseek bietet neben einem Bildgenerator einige verschiedene Modelle - R1 und V3 - an. Das Wichtigste ist, dass sie billiger, effizienter und freier verfügbar sind als die Top -Konkurrenten, was bedeutet, dass OpenAs Chatgpt möglicherweise seine Krone als Königin -Biene von AI -Modellen verloren hat.

Hier ist, was Sie über alle wissen sollten.

Deepseek R1

Das Deepseek -Modell, das jeder jetzt verwendet, ist R1.

Über Tech.co Video Thumbnail zeigt, dass der Hauptautor Conor Cawley neben dem Tech.co -Logo lächelt Das gerade! Sicht
Die Top Business Tech Deals für 2025 👨‍💻
Sehen Sie sich die Listenschaltfläche an

Es ist ganz oben im App Store -das Ausschalten von Chatgpt-und es ist die Version, die derzeit im Web und im Open-Source mit einer frei verfügbaren API verfügbar ist. Im Gegensatz zu einigen anderen in China ansässigen Modellen, die sich mit ChatGPT befassen, sind KI-Experten beeindruckt von der Fähigkeit, die R1 bietet.

Wie der einflussreiche Tech -Investor Marc Andreessen vor ein paar Tagen ausdrückte: „Deepseek R1 ist einer der erstaunlichsten und beeindruckendsten Durchbrüche, die ich je gesehen habe - und als Open Source, ein tiefgreifendes Geschenk an die Welt.“

Es ist auch billiger zu arbeiten als Chatgpt: möglicherweise 20- bis 50 -mal billiger.

Die Art von Chip, die die Modelle von Deepseek trainiert, gibt einige unbegründete Art von Chip, wobei einige unbegründete Behauptungen besagen, dass das Unternehmen A100 -Chips verwendet hat, die derzeit vom US -Export nach China verboten sind.

Deepseek v3

Das andere große Modell des Unternehmens ist jedoch das, was das Silicon Valley erschreckt: Deepseek V3.

Das V3 -Modell war billig zu trainieren, viel billiger als viele KI -Experten für möglich gehalten hatten: Laut Deepseek dauerte das Training nur 2.788 Tausend H800 GPU -Stunden, was nur 5,576 Millionen US -Dollar erhöhte, wobei 2 US -Dollar pro GPU pro Stunde angenommen wurden.

V3 ist ein effizienteres Modell, da es auf einer 671B-Parameter-MOE-Architektur mit 37B aktivierten Parametern pro Token arbeitet.

Text-to-Image-Generation: Janus Pro

Außerdem gibt es Janus Pro , den Text-zu-Image-Generator des Unternehmens.

Deepseek hat berichtet, dass sein Janus-Pro-7b-AI-Modell OpenAs Dall-E 3 und Stabilitäts-AI-stabiler Diffusion übertroffen hat.

Laut dem Unternehmen wurde dieses Modell auf „72 Millionen hochwertigen synthetischen Bildern“ geschult.

Deepseek kann lokal laufen

Eine letzte Sache zu wissen: Deepseek kann lokal ausgeführt werden , ohne dass eine Internetverbindung erforderlich ist. Dies ist Teil und Paket mit der Open-Source-Veröffentlichung des Modells: Da der Code auf GitHub verfügbar ist, kann er heruntergeladen werden.

Dies ist eine weitere Verbesserung gegenüber beliebten KI-Modellen wie OpenAI und-zumindest für diejenigen, die sich für die Leitung der KI vor Ort entschieden haben-, bedeutet, dass das in China ansässige Unternehmen keine Möglichkeit gibt, die auf Benutzerdaten zugreifen.

Als Reaktion darauf ist Nvidias Aktie weit nach unten

Deepseek markiert eine große Erschütterung des beliebten Ansatzes für KI-Tech in den USA: Die KI-Modelle des chinesischen Unternehmens wurden mit einem Bruchteil der Ressourcen gebaut, lieferten jedoch die Waren und sind Open-Source, um zu booten. Die anfängliche Reaktion war ein großer Rückgang der Aktienkurse für die größten US-amerikanischen KI-Unternehmen.

Die AI-Chip-Firma Nvidia verzeichnete den größten Aktienrückgang seiner Geschichte und verlor als Reaktion auf die Deepseek News um 16,86%, als Aktien um 16,86% fielen .

Wie schlimm ist das? Nun, es ist mehr als doppelt so viel wie jedes andere einzelne US -Unternehmen, das jemals in einem Tag gesunken ist . Mit anderen Worten, es ist nicht großartig.

Die bisherige Antwort des Unternehmens: Es wird zugegeben, dass das R1 -Modell von Deepseek „ein ausgezeichneter KI -Fortschritt“ ist.

Andere US -Aktien sind ebenfalls unten

Die Aktien fielen auch an anderen Chipmachern wie dem niederländischen Unternehmen ASML, während der S & P 500 um mehr als 2% fiel und Nasdaq um 3,5% fiel.

Viele Experten sagen voraus, dass sich die Volatilität der Aktienmarkte bald niederlassen wird. Dies könnte jedoch das Ende einer Ära für den ständigen steilen Aufwärtstrend für Unternehmen wie Nvidia markieren, das seit Anfang 2023 ein unglaublich hohes Wachstum verzeichnete.

Aber das sind gute Nachrichten für einige Tech -Riesen

Wie verändert sich die KI -Landschaft, wenn Deepseek das nächste Top -Modell Amerikas ist?

Meta ist wahrscheinlich ein großer Gewinner hier: Das Unternehmen braucht billige KI-Modelle, um erfolgreich zu sein, und jetzt ist der nächste Geldsparungsaufstieg hier.

Microsoft spart auch Geld in Rechenzentren, während Amazon die neu verfügbaren Open -Source -Modelle nutzen kann.

Google dagegen hätte gestanden, um das meiste Geld aus all diesen Rechenzentren zu verdienen. Etwas sagt uns, dass der massive Tech -Riese jedoch über Wasser bleibt. Auf lange Sicht ist die billige Open-Source-KI im Allgemeinen immer noch gut für Technologieunternehmen, auch wenn sie insgesamt nicht großartig für die USA ist.

Wie faktor der 500-Milliarden-Dollar-Programm für das Stargate-Programm in Höhe von 500 Milliarden US-Dollar?

Die Deepseek -Störung kommt nur wenige Tage nach einer großen Ankündigung von Präsident Trump: Die US -Regierung wird 500 Milliarden US -Dollar in „Stargate“, ein gemeinsames KI in ai.

Zu den Plänen der Initiative gehört der Bau von 20 Rechenzentren in den USA sowie die Schaffung von „Hunderttausenden“ von Arbeitsplätzen, obwohl die letztere Behauptung zweifelhaft erscheint, basierend auf dem Ergebnis ähnlicher früherer Behauptungen .

Mit dieser Augenwater-Investition scheint die US-Regierung ihr Gewicht hinter einer Überschussstrategie zu werfen: Milliarden in die Lösung ihrer KI-Probleme einschenken, unter der Annahme, dass mehr als jedes andere Land eine bessere KI als jedes andere Land liefern wird.

Jetzt ist Deepseek aufgetaucht, um ein Loch in diese These zu stechen. Wenn Deepseek mit weniger als einem Zehntel des Entwicklungsbudgets die gleichen Ergebnisse erzielen kann, sehen all diese Milliarden nicht nach einer sicheren Wette aus.

Die Börse scheint - zumindest vorerst - zuzustimmen.