Что такое DeepSeek? Новый ИИ Китай теперь открытый источник
Опубликовано: 2025-01-28DeepSeek - последний мультимодальный ИИ.
Технически, DeepSeek - это название китайской компании, выходящей из моделей. Сами текущие модели называются «R1» и «V1». Оба сильно встряхивают всю индустрию искусственного интеллекта после выпуска R1 в США в США.
Почему? Он поставляется с очень низкими затратами на разработку, это открытый источник для коммерческого использования, и он подрывает таких конкурентов, как Openai -прямо в то время, когда правительство США делает ставку на все большие ставки, чем когда-либо, на свои собственные доморощенные достижения искусственного интеллекта .
Что мне нужно знать о DeepSeek?
DeepSeek предлагает пару различных моделей - R1 и V3 - в дополнение к генератору изображений. Ключевым моментом является то, что они более дешевые, более эффективные и более свободно доступные, чем ведущие конкуренты, что означает, что CHATGPT Openai, возможно, потерял свою корону в качестве пчелы Queen of Mi Models.
Вот что знать обо всех них.
DeepSeek R1
Модель DeepSeek, которую все используют сейчас, - R1.
Это только в! Вид
Лучшие сделки бизнес -технологий за 2025 год 👨💻
Он находится в верхней части App Store -выбивая CHATGPT-и это версия, которая в настоящее время доступна в Интернете и с открытым исходным кодом, с свободно доступным API. В отличие от некоторых других китайских моделей, стремящихся конкурировать с CHATGPT, эксперты по искусственному искусству впечатляют способность, которую предлагает R1.
Как сказал это влиятельный технический инвестор Марк Андрессен несколько дней назад: «Deepseek R1 - один из самых удивительных и впечатляющих прорывов, которые я когда -либо видел - и как открытый исходный код, глубокий подарок миру».
Это также дешевле, чем Chatgpt, возможно, в 20-50 раз дешевле.
Существует некоторая мрчата, связанная с типом чипа, используемого для обучения моделей Deepseek, с некоторыми необоснованными претензиями, в которых говорится, что компания использовала A100 чипов, которые в настоящее время запрещены из экспорта США в Китай.
DeepSeek v3
Тем не менее, другая большая модель компании - это то, что пугает Силиконовая долина: Deepseek V3.
Модель V3 была дешевой для тренировки, намного дешевле, чем многие эксперты по ИИ считали возможным: по словам DeepSeek, обучение заняло всего 2788 тысяч часов H800 H800 часов, что составляет всего 5,576 миллиона долларов , предполагая 2 доллара за графический процессор в час.

V3 является более эффективной моделью, поскольку он работает на архитектуре MoE 671B-параметра с активированными параметрами 37B на токен-сокращение вычислительных накладных расходов, требуемых CHATGPT и его 1,8T-параметра .
Поколение текста до изображения: Janus Pro
Кроме того, есть Janus Pro , генератор текста до изображения компании.
DeepSeek сообщила, что ее модель AI Janus-Pro-7B опередила стабильную диффузию AI от Openai и стабильность AI Stability , согласно рейтингу лидеров для генерации изображений с использованием текстовых подсказок.
По словам компании, эта модель была обучена «72 миллионам высококачественных синтетических изображений».
DeepSeek может работать локально
Последнее, что нужно знать: DeepSeek можно запустить локально , без необходимости подключения к Интернету. Это часть и посылка с выпуском с открытым исходным кодом модели: поскольку код доступен на GitHub, его можно загрузить.
Это знаменует собой еще одно улучшение по сравнению с популярными моделями ИИ, такими как OpenAI, и, по крайней мере, для тех, кто решил запустить ИИ на местном уровне,-это означает, что нет возможности получить доступ к Китайской компании.
В ответ акции Nvidia - это путь, далеко вниз
DeepSeek отмечает большую встряску в популярном подходе к AI Tech в США: модели искусственного интеллекта китайской компании были построены с частью ресурсов, но доставляли товары и являются открытым исходным кодом для загрузки. Первоначальный ответ был большим падением цен на акции для крупнейших американских компаний ИИ.
Компания AI Chip Nvidia увидела наибольшее падение акций в своей истории, потеряв почти 600 миллиардов долларов в области фондового рынка, когда акции упали на 16,86% в ответ на Deepseek News.
Насколько это плохо? Ну, это более чем в два раза больше, чем любая другая отдельная американская компания, которая когда -либо упала за один день . Другими словами, это не здорово.
До сих пор ответ компании: признается, что модель Diepseek R1 является «превосходным развитием ИИ».
Другие акции США тоже недовольны
Акции упали и на других производителей чипов, таких как голландская компания ASML, в то время как S & P 500 упал более чем на 2%, а Nasdaq упал на 3,5%.
Множество экспертов предсказывают, что волатильность фондового рынка скоро успокоится. Тем не менее, это может ознаменовать конец эпохи для постоянного крутого тенденции к росту для таких компаний, как Nvidia, которые наблюдали невероятно высокий рост с начала 2023 года.
Но это хорошая новость для некоторых технических гигантов
Итак, как изменится ландшафт ИИ, если DeepSeek является следующей топ -моделью Америки?
Мета , вероятно, является большим победителем здесь: компании нужны дешевые модели искусственного интеллекта, чтобы добиться успеха, и теперь следующее продвижение по экономии денег здесь.
Microsoft также будет экономить деньги в центрах обработки данных, в то время как Amazon может воспользоваться недавно доступными моделями с открытым исходным кодом.
Google, с другой стороны, заработал бы максимум денег из всех этих центров обработки данных. Однако что -то говорит нам, что массивный технический гигант останется на плаву. В долгосрочной перспективе, дешевый ИИ с открытым исходным кодом по-прежнему хорошо подходит для технологических компаний в целом, даже если он может не быть отличным для США в целом.
Как фактор программы Stargate в США за 500 миллиардов долларов?
Разрушение DeepSeek произошло всего через несколько дней после большого объявления президента Трампа: правительство США погрузится в 500 миллиардов долларов в «Звездную врата», совместное предприятие ИИ с OpenAI, SoftBank и Oracle, целью которого является укрепление США как мирового лидера в AI.
Среди планов инициативы - строительство 20 центров обработки данных по всей территории США , а также создание «сотен тысяч» рабочих мест, хотя последнее требование кажется сомнительным, основываясь на результатах аналогичных предыдущих претензий .
С этими глазами, уделяющимися инвестициям, правительство США, безусловно, выбрасывает свой вес позади стратегии избытка: изливать миллиарды в решение проблем с ИИ, согласно предположению, что уплата больше, чем любая другая страна, будет обеспечить лучшее ИИ, чем любая другая страна.
Теперь DeepSeek появился, чтобы пробить дыру в этом тезисе. Если DeepSeek может получить те же результаты менее чем на десятую часть бюджета на разработку, все эти миллиарды не выглядят таковой верной ставкой.
Фондовый рынок - пока, по крайней мере, - кажется, согласен.