什么是DeepSeek？中国的新AI现在是开源的

已发表: 2025-01-28

DeepSeek是最新的多模式AI。

从技术上讲，DeepSeek是中国公司发布模型的名称。当前的模型本身称为“ R1”和“ V1”。在R1在1月20日在美国发行后，两者都在震撼整个AI行业。

为什么？它具有非常低的开发成本，是用于商业用途的开源，并且削弱了像Openai这样的竞争对手 - 就在美国政府比以往任何时候都以自己的本土AI的进步更大的赌注下注。

关于DeepSeek，我需要了解什么？

DeepSeek除了图像发生器外，还提供了几种不同的型号 - R1和V3。要知道的关键是，它们比顶级竞争对手便宜，更高效，更自由地获得，这意味着Openai的Chatgpt可能失去了王冠作为AI模型的女王蜜蜂。

这是所有这些都知道的。

每个人现在正在使用的DeepSeek模型是R1。

关于tech.co视频缩略图显示首席作家Conor Cawley在Tech.co徽标旁边微笑 这只是在！看法
2025年的最高商业技术交易👨‍💻
查看列表按钮

它位于App Store的顶部（击败ChatGpt），它是当前在网络和开放源代码上可用的版本，并带有免费的API。与其他旨在与CHATGPT竞争的中国模型不同，R1提供的能力给人留下了深刻的印象。

正如有影响力的科技投资者马克·安德森（Marc Andreessen）在几天前所说：“ DeepSeek R1是我见过的最令人惊叹，最令人印象深刻的突破之一，作为开源的，这是对世界的深刻礼物。”

这也比Chatgpt便宜：可能价格便宜20至50倍。

围绕用于训练DeepSeek模型的芯片类型的类型有些朦胧，一些未经证实的说法表明，该公司使用了A100芯片，目前已从美国出口到中国。

但是，该公司的另一个大型模型是吓silicon山谷的东西：DeepSeek V3。

V3型号的训练价格便宜，比许多AI专家认为的便宜：根据DeepSeek的说法，培训仅花费了2,7.88亿H800 GPU小时，高达55.76亿美元，假设每小时每小时每小时2美元。

V3是一个更有效的模型，因为它在每个令牌上具有37B激活参数的671B参数MOE体系结构- 削减了Chatgpt及其1.8T参数设计所需的计算开销。

另外，还有公司的文本对图像生成器Janus Pro 。

DeepSeek报道说，根据文本提示，其Janus-Pro-7b AI模型的表现优于OpenAI的DALL-E 3和稳定性AI的稳定扩散。

据该公司称，该模型接受了“ 7200万个高质量合成图像”的培训。

要知道的最后一件事是： DeepSeek可以在本地运行，而无需互联网连接。这是该模型的开源版本的一部分和包裹：由于该代码可在GitHub上找到，因此可以下载。

这标志着对OpenAI等流行的AI模型的另一种改进，至少对于那些选择在当地运行AI的人来说，这意味着基于中国的公司不可能访问用户数据。

DeepSeek标志着美国流行的AI Tech方法的重大改动：中国公司的AI型号是用一小部分资源来建造的，但交付了商品并是开源的，可以启动。最初的回应是，美国最大的AI公司的股票价格大幅下跌。

AI Chip公司NVIDIA的历史股票下跌最大，当股票以响应DeepSeek News的响应时，股市价值下降了近6000亿美元。

那有多糟糕？好吧，它是任何其他单一单一单一公司在一天之内都下降的两倍以上。换句话说，这不是很好。

该公司到目前为止的回应：承认DeepSeek的R1模型是“极好的AI进步”。

股票也下降了其他芯片制造商，例如荷兰公司ASML，而标准普尔500指数下跌了2％以上，纳斯达克股价下跌了3.5％。

许多专家预测，股市波动将很快降低。但是，这可能标志着Nvidia等公司不断陡峭的上升趋势的时代结束，该公司自2023年初以来一直在增长令人难以置信的高增长。

那么，如果DeepSeek是美国的下一个顶级模型，AI景观会如何变化？

Meta可能在这里是一个很大的赢家：该公司需要廉价的AI模型才能成功，现在下一个省钱的进步就在这里。

微软还将在数据中心节省资金，而亚马逊可以利用新的开源模型。

另一方面，Google将立即从所有这些数据中心中赚钱。但是，有些事情告诉我们，这家庞大的科技巨头将保持漂浮。从长远来看，即使对美国总体来说，廉价的开源AI仍然对科技公司仍然有益。

在特朗普总统的重大宣布之后，DeepSeek的破坏仅几天之后：美国政府将向“ Stargate”下沉5000亿美元，这是与OpenAI，Softai，Softbank和Oracle的联合AI合资企业，旨在巩固美国的世界领导人。在AI中。

该计划的计划包括在美国建造20个数据中心，以及创建“成千上万的工作”，尽管后者的主张似乎是可疑的，这是基于类似先前的主张的结果。

通过这项令人陶醉的投资，美国政府似乎将其重视抛在了一项过剩策略之后：在假设付款比其他任何国家都比其他任何国家都更好的AI付费的情况下倾注数十亿美元以解决其AI问题。

现在，DeepSeek已出现在该论文中戳一个洞。如果DeepSeek在不到开发预算的十分之一的情况下可以获得相同的结果，那么所有这些数十亿美元看起来并不是一个肯定的赌注。

至少目前，股票市场似乎同意。