什么是DeepSeek?中国的新AI现在是开源的
已发表: 2025-01-28DeepSeek是最新的多模式AI。
从技术上讲,DeepSeek是中国公司发布模型的名称。当前的模型本身称为“ R1”和“ V1”。在R1在1月20日在美国发行后,两者都在震撼整个AI行业。
为什么?它具有非常低的开发成本,是用于商业用途的开源,并且削弱了像Openai这样的竞争对手 - 就在美国政府比以往任何时候都以自己的本土AI的进步更大的赌注下注。
关于DeepSeek,我需要了解什么?
DeepSeek除了图像发生器外,还提供了几种不同的型号 - R1和V3。要知道的关键是,它们比顶级竞争对手便宜,更高效,更自由地获得,这意味着Openai的Chatgpt可能失去了王冠作为AI模型的女王蜜蜂。
这是所有这些都知道的。
DeepSeek R1
每个人现在正在使用的DeepSeek模型是R1。
这只是在!看法
2025年的最高商业技术交易👨💻
它位于App Store的顶部(击败ChatGpt),它是当前在网络和开放源代码上可用的版本,并带有免费的API。与其他旨在与CHATGPT竞争的中国模型不同,R1提供的能力给人留下了深刻的印象。

正如有影响力的科技投资者马克·安德森(Marc Andreessen)在几天前所说:“ DeepSeek R1是我见过的最令人惊叹,最令人印象深刻的突破之一,作为开源的,这是对世界的深刻礼物。”
这也比Chatgpt便宜:可能价格便宜20至50倍。
围绕用于训练DeepSeek模型的芯片类型的类型有些朦胧,一些未经证实的说法表明,该公司使用了A100芯片,目前已从美国出口到中国。
DeepSeek V3
但是,该公司的另一个大型模型是吓silicon山谷的东西:DeepSeek V3。
V3型号的训练价格便宜,比许多AI专家认为的便宜:根据DeepSeek的说法,培训仅花费了2,7.88亿H800 GPU小时,高达55.76亿美元,假设每小时每小时每小时2美元。
V3是一个更有效的模型,因为它在每个令牌上具有37B激活参数的671B参数MOE体系结构- 削减了Chatgpt及其1.8T参数设计所需的计算开销。
文本到图像一代:Janus Pro
另外,还有公司的文本对图像生成器Janus Pro 。
DeepSeek报道说,根据文本提示,其Janus-Pro-7b AI模型的表现优于OpenAI的DALL-E 3和稳定性AI的稳定扩散。
据该公司称,该模型接受了“ 7200万个高质量合成图像”的培训。
DeepSeek可以在当地运行
要知道的最后一件事是: DeepSeek可以在本地运行,而无需互联网连接。这是该模型的开源版本的一部分和包裹:由于该代码可在GitHub上找到,因此可以下载。
这标志着对OpenAI等流行的AI模型的另一种改进,至少对于那些选择在当地运行AI的人来说,这意味着基于中国的公司不可能访问用户数据。
作为回应,Nvidia的股票是下降的
DeepSeek标志着美国流行的AI Tech方法的重大改动:中国公司的AI型号是用一小部分资源来建造的,但交付了商品并是开源的,可以启动。最初的回应是,美国最大的AI公司的股票价格大幅下跌。
AI Chip公司NVIDIA的历史股票下跌最大,当股票以响应DeepSeek News的响应时,股市价值下降了近6000亿美元。
那有多糟糕?好吧,它是任何其他单一单一单一公司在一天之内都下降的两倍以上。换句话说,这不是很好。
该公司到目前为止的回应:承认DeepSeek的R1模型是“极好的AI进步”。
美国其他股票也下降了
股票也下降了其他芯片制造商,例如荷兰公司ASML,而标准普尔500指数下跌了2%以上,纳斯达克股价下跌了3.5%。
许多专家预测,股市波动将很快降低。但是,这可能标志着Nvidia等公司不断陡峭的上升趋势的时代结束,该公司自2023年初以来一直在增长令人难以置信的高增长。
但这对一些科技巨头来说是个好消息
那么,如果DeepSeek是美国的下一个顶级模型,AI景观会如何变化?
Meta可能在这里是一个很大的赢家:该公司需要廉价的AI模型才能成功,现在下一个省钱的进步就在这里。
微软还将在数据中心节省资金,而亚马逊可以利用新的开源模型。
另一方面,Google将立即从所有这些数据中心中赚钱。但是,有些事情告诉我们,这家庞大的科技巨头将保持漂浮。从长远来看,即使对美国总体来说,廉价的开源AI仍然对科技公司仍然有益。
美国的500亿美元星际之门计划如何进化?
在特朗普总统的重大宣布之后,DeepSeek的破坏仅几天之后:美国政府将向“ Stargate”下沉5000亿美元,这是与OpenAI,Softai,Softbank和Oracle的联合AI合资企业,旨在巩固美国的世界领导人。在AI中。
该计划的计划包括在美国建造20个数据中心,以及创建“成千上万的工作”,尽管后者的主张似乎是可疑的,这是基于类似先前的主张的结果。
通过这项令人陶醉的投资,美国政府似乎将其重视抛在了一项过剩策略之后:在假设付款比其他任何国家都比其他任何国家都更好的AI付费的情况下倾注数十亿美元以解决其AI问题。
现在,DeepSeek已出现在该论文中戳一个洞。如果DeepSeek在不到开发预算的十分之一的情况下可以获得相同的结果,那么所有这些数十亿美元看起来并不是一个肯定的赌注。
至少目前,股票市场似乎同意。