什麼是DeepSeek？中國的新AI現在是開源的

已發表: 2025-01-28

DeepSeek是最新的多模式AI。

從技術上講，DeepSeek是中國公司發布模型的名稱。當前的模型本身稱為“ R1”和“ V1”。在R1在1月20日在美國發行後，兩者都在震撼整個AI行業。

為什麼？它具有非常低的開發成本，是用於商業用途的開源，並且削弱了像Openai這樣的競爭對手 - 就在美國政府比以往任何時候都以自己的本土AI的進步更大的賭注下注。

關於DeepSeek，我需要了解什麼？

DeepSeek除了圖像發生器外，還提供了幾種不同的型號 - R1和V3。要知道的關鍵是，它們比頂級競爭對手便宜，更高效，更自由地獲得，這意味著Openai的Chatgpt可能失去了王冠作為AI模型的女王蜜蜂。

這是所有這些都知道的。

每個人現在正在使用的DeepSeek模型是R1。

關於tech.co視頻縮略圖顯示首席作家Conor Cawley在Tech.co徽標旁邊微笑 這只是在！看法
2025年的最高商業技術交易👨‍💻
查看列表按鈕

它位於App Store的頂部（擊敗ChatGpt），它是當前在網絡和開放源代碼上可用的版本，並帶有免費的API。與其他旨在與CHATGPT競爭的中國模型不同，R1提供的能力給人留下了深刻的印象。

正如有影響力的科技投資者馬克·安德森（Marc Andreessen）在幾天前所說：“ DeepSeek R1是我見過的最令人驚嘆，最令人印象深刻的突破之一，作為開源的，這是對世界的深刻禮物。”

這也比Chatgpt便宜：可能價格便宜20至50倍。

圍繞用於訓練DeepSeek模型的芯片類型的類型有些朦朧，一些未經證實的說法表明，該公司使用了A100芯片，目前已從美國出口到中國。

但是，該公司的另一個大型模型是嚇silicon山谷的東西：DeepSeek V3。

V3型號的訓練價格便宜，比許多AI專家認為的便宜：根據DeepSeek的說法，培訓僅花費了2,7.88億H800 GPU小時，高達55.76億美元，假設每小時每小時每小時2美元。

V3是一個更有效的模型，因為它在每個令牌上具有37B激活參數的671B參數MOE體系結構- 削減了Chatgpt及其1.8T參數設計所需的計算開銷。

另外，還有公司的文本對圖像生成器Janus Pro 。

DeepSeek報導說，根據文本提示，其Janus-Pro-7b AI模型的表現優於OpenAI的DALL-E 3和穩定性AI的穩定擴散。

據該公司稱，該模型接受了“ 7200萬個高質量合成圖像”的培訓。

要知道的最後一件事是： DeepSeek可以在本地運行，而無需互聯網連接。這是該模型的開源版本的一部分和包裹：由於該代碼可在GitHub上找到，因此可以下載。

這標誌著對OpenAI等流行的AI模型的另一種改進，至少對於那些選擇在當地運行AI的人來說，這意味著基於中國的公司不可能訪問用戶數據。

DeepSeek標誌著美國流行的AI Tech方法的重大改動：中國公司的AI型號是用一小部分資源來建造的，但交付了商品並是開源的，可以啟動。最初的回應是，美國最大的AI公司的股票價格大幅下跌。

AI Chip公司NVIDIA的歷史股票下跌最大，當股票以響應DeepSeek News的響應時，股市價值下降了近6000億美元。

那有多糟糕？好吧，它是任何其他單一單一單一公司在一天之內都下降的兩倍以上。換句話說，這不是很好。

該公司到目前為止的回應：承認DeepSeek的R1模型是“極好的AI進步”。

股票也下降了其他芯片製造商，例如荷蘭公司ASML，而標準普爾500指數下跌了2％以上，納斯達克股價下跌了3.5％。

許多專家預測，股市波動將很快降低。但是，這可能標誌著Nvidia等公司不斷陡峭的上升趨勢的時代結束，該公司自2023年初以來一直在增長令人難以置信的高增長。

那麼，如果DeepSeek是美國的下一個頂級模型，AI景觀會如何變化？

Meta可能在這裡是一個很大的贏家：該公司需要廉價的AI模型才能成功，現在下一個省錢的進步就在這裡。

微軟還將在數據中心節省資金，而亞馬遜可以利用新的開源模型。

另一方面，Google將立即從所有這些數據中心中賺錢。但是，有些事情告訴我們，這家龐大的科技巨頭將保持漂浮。從長遠來看，即使對美國總體來說，廉價的開源AI仍然對科技公司仍然有益。

在特朗普總統的重大宣布之後，DeepSeek的破壞僅幾天之後：美國政府將向“ Stargate”下沉5000億美元，這是與OpenAI，Softai，Softbank和Oracle的聯合AI合資企業，旨在鞏固美國的世界領導人。在AI中。

該計劃的計劃包括在美國建造20個數據中心，以及創建“成千上萬的工作”，儘管後者的主張似乎是可疑的，這是基於類似先前的主張的結果。

通過這項令人陶醉的投資，美國政府似乎將其重視拋在了一項過剩策略之後：在假設付款比其他任何國家都比其他任何國家都更好的AI付費的情況下傾注數十億美元以解決其AI問題。

現在，DeepSeek已出現在該論文中戳一個洞。如果DeepSeek在不到開發預算的十分之一的情況下可以獲得相同的結果，那麼所有這些數十億美元看起來並不是一個肯定的賭注。

至少目前，股票市場似乎同意。