什麼是DeepSeek?中國的新AI現在是開源的
已發表: 2025-01-28DeepSeek是最新的多模式AI。
從技術上講,DeepSeek是中國公司發布模型的名稱。當前的模型本身稱為“ R1”和“ V1”。在R1在1月20日在美國發行後,兩者都在震撼整個AI行業。
為什麼?它具有非常低的開發成本,是用於商業用途的開源,並且削弱了像Openai這樣的競爭對手 - 就在美國政府比以往任何時候都以自己的本土AI的進步更大的賭注下注。
關於DeepSeek,我需要了解什麼?
DeepSeek除了圖像發生器外,還提供了幾種不同的型號 - R1和V3。要知道的關鍵是,它們比頂級競爭對手便宜,更高效,更自由地獲得,這意味著Openai的Chatgpt可能失去了王冠作為AI模型的女王蜜蜂。
這是所有這些都知道的。
DeepSeek R1
每個人現在正在使用的DeepSeek模型是R1。
這只是在!看法
2025年的最高商業技術交易👨💻
它位於App Store的頂部(擊敗ChatGpt),它是當前在網絡和開放源代碼上可用的版本,並帶有免費的API。與其他旨在與CHATGPT競爭的中國模型不同,R1提供的能力給人留下了深刻的印象。

正如有影響力的科技投資者馬克·安德森(Marc Andreessen)在幾天前所說:“ DeepSeek R1是我見過的最令人驚嘆,最令人印象深刻的突破之一,作為開源的,這是對世界的深刻禮物。”
這也比Chatgpt便宜:可能價格便宜20至50倍。
圍繞用於訓練DeepSeek模型的芯片類型的類型有些朦朧,一些未經證實的說法表明,該公司使用了A100芯片,目前已從美國出口到中國。
DeepSeek V3
但是,該公司的另一個大型模型是嚇silicon山谷的東西:DeepSeek V3。
V3型號的訓練價格便宜,比許多AI專家認為的便宜:根據DeepSeek的說法,培訓僅花費了2,7.88億H800 GPU小時,高達55.76億美元,假設每小時每小時每小時2美元。
V3是一個更有效的模型,因為它在每個令牌上具有37B激活參數的671B參數MOE體系結構- 削減了Chatgpt及其1.8T參數設計所需的計算開銷。
文本到圖像一代:Janus Pro
另外,還有公司的文本對圖像生成器Janus Pro 。
DeepSeek報導說,根據文本提示,其Janus-Pro-7b AI模型的表現優於OpenAI的DALL-E 3和穩定性AI的穩定擴散。
據該公司稱,該模型接受了“ 7200萬個高質量合成圖像”的培訓。
DeepSeek可以在當地運行
要知道的最後一件事是: DeepSeek可以在本地運行,而無需互聯網連接。這是該模型的開源版本的一部分和包裹:由於該代碼可在GitHub上找到,因此可以下載。
這標誌著對OpenAI等流行的AI模型的另一種改進,至少對於那些選擇在當地運行AI的人來說,這意味著基於中國的公司不可能訪問用戶數據。
作為回應,Nvidia的股票是下降的
DeepSeek標誌著美國流行的AI Tech方法的重大改動:中國公司的AI型號是用一小部分資源來建造的,但交付了商品並是開源的,可以啟動。最初的回應是,美國最大的AI公司的股票價格大幅下跌。
AI Chip公司NVIDIA的歷史股票下跌最大,當股票以響應DeepSeek News的響應時,股市價值下降了近6000億美元。
那有多糟糕?好吧,它是任何其他單一單一單一公司在一天之內都下降的兩倍以上。換句話說,這不是很好。
該公司到目前為止的回應:承認DeepSeek的R1模型是“極好的AI進步”。
美國其他股票也下降了
股票也下降了其他芯片製造商,例如荷蘭公司ASML,而標準普爾500指數下跌了2%以上,納斯達克股價下跌了3.5%。
許多專家預測,股市波動將很快降低。但是,這可能標誌著Nvidia等公司不斷陡峭的上升趨勢的時代結束,該公司自2023年初以來一直在增長令人難以置信的高增長。
但這對一些科技巨頭來說是個好消息
那麼,如果DeepSeek是美國的下一個頂級模型,AI景觀會如何變化?
Meta可能在這裡是一個很大的贏家:該公司需要廉價的AI模型才能成功,現在下一個省錢的進步就在這裡。
微軟還將在數據中心節省資金,而亞馬遜可以利用新的開源模型。
另一方面,Google將立即從所有這些數據中心中賺錢。但是,有些事情告訴我們,這家龐大的科技巨頭將保持漂浮。從長遠來看,即使對美國總體來說,廉價的開源AI仍然對科技公司仍然有益。
美國的500億美元星際之門計劃如何進化?
在特朗普總統的重大宣布之後,DeepSeek的破壞僅幾天之後:美國政府將向“ Stargate”下沉5000億美元,這是與OpenAI,Softai,Softbank和Oracle的聯合AI合資企業,旨在鞏固美國的世界領導人。在AI中。
該計劃的計劃包括在美國建造20個數據中心,以及創建“成千上萬的工作”,儘管後者的主張似乎是可疑的,這是基於類似先前的主張的結果。
通過這項令人陶醉的投資,美國政府似乎將其重視拋在了一項過剩策略之後:在假設付款比其他任何國家都比其他任何國家都更好的AI付費的情況下傾注數十億美元以解決其AI問題。
現在,DeepSeek已出現在該論文中戳一個洞。如果DeepSeek在不到開發預算的十分之一的情況下可以獲得相同的結果,那麼所有這些數十億美元看起來並不是一個肯定的賭注。
至少目前,股票市場似乎同意。