Deepseekとは何ですか?中国の新しいAIは現在オープンソースになっています

公開: 2025-01-28

Deepseekは最新のマルチモーダルAIです。

技術的には、DeepSeekはモデルをリリースする中国企業の名前です。現在のモデル自体は「R1」と「V1」と呼ばれます。両方とも、R1の1月20日の米国でのリリースに続いてAI業界全体を大幅に揺さぶっています。

なぜ?開発コストが非常に低く、商業使用のためのオープンソースであり、 Openaiのようなライバルを覆います。これは、米国政府が自国のAIの進歩についてこれまで以上に重く賭けたときです。

Deepseekについて何を知る必要がありますか?

Deepseekは、画像ジェネレーターに加えて、R1とV3のいくつかの異なるモデルを提供しています。知っておくべき重要なことは、トップの競合他社よりも安価で効率的で、より自由に利用できるということです。つまり、OpenaiのChatGptはAIモデルのクイーンビーとして王冠を失った可能性があります。

それらすべてについて知っておくべきことは次のとおりです。

Deepseek R1

誰もが現在使用しているDeepSeekモデルはR1です。

Tech.coビデオサムネイルについては、Tech.coのロゴの隣で笑顔のリードライターのコナー・カウリーを示していますこれはちょうど!ビュー
2025年のトップビジネス技術取引
リストボタンを参照してください

App Storeの最上部にあります - ChatGptを打ち負かします - そして、自由に利用できるAPIを備えたWebおよびオープンソースで現在利用可能なバージョンです CHATGPTと競争することを目的とした他の中国に拠点を置くモデルとは異なり、AIの専門家はR1が提供する能力に感銘を受けています。

影響力のあるハイテク投資家であるマーク・アンドリーセンは、数日前にそれを述べました。

ChatGptよりも操作する方がはるかに安いです。おそらく20〜50倍安いです。

Deepseekのモデルを訓練するために使用されるチップの種類をめぐるいくつかの重視があり、現在、米国への輸出から禁止されているA100チップを使用していると述べている根拠のない主張がいくつかあります。

Deepseek V3

ただし、同社の他の大きなモデルは、シリコンバレーの怖がっているものです:Deepseek V3。

V3モデルは、多くのAIの専門家が可能だと考えていたよりもはるかに安価で、トレーニングが安くなりました。DeepSeekによると、トレーニングはわずか2,788,000 H800 GPU時間を費やし、1時間あたり1 gpuあたり2ドルのコストを想定して、わずか5576百万ドルになりました。

V3は、トークンごとに37Bのアクティブ化されたパラメーターを備えた671BパラメーターMOEアーキテクチャで動作するため、より効率的なモデルです。CHATGPTとその1.8Tパラメーター設計に必要な計算オーバーヘッドを削減します。

テキストからイメージの生成:Janus Pro

さらに、同社のテキストからイメージまでのジェネレーターであるJanus Proがあります。

Deepseekは、テキストプロンプトを使用した画像生成のリーダーボードランキングによると、Janus-Pro-7B AIモデルがOpenaiのDall-E 3と安定性AIの安定した拡散を上回っていると報告しています。

同社によると、このモデルは「7,200万の高品質の合成画像」でトレーニングされました。

DeepSeekはローカルで実行できます

最後に知っておくべきこと: DeepSeekは、インターネット接続を必要とせずにローカルで実行できます。これは、モデルのオープンソースリリースの一部であり、小包です。コードはGitHubで利用可能であるため、ダウンロードできます。

これは、Openaiのような人気のあるAIモデルに対する別の改善、および少なくともAIをローカルで実行することを選択した人にとっては、中国に本拠を置く会社がユーザーデータにアクセスする可能性がないことを意味します。

これに応じて、Nvidiaの株はかなり下がります

Deepseekは、米国のAI Techへの人気のあるアプローチへの大きなシェイクアップを示しています。中国企業のAIモデルは、一部のリソースで構築されましたが、商品を配信し、オープンソースであるため、起動します。最初の対応は、米国最大のAI企業の株価の大幅な低下でした。

AIチップ会社Nvidiaは、歴史の中で最大の株式減少を見て、Deepseekニュースに応じて株式が16.86%減少したため、株式市場の価値は6,000億ドル近く減少しました

それはどれほど悪いですか?まあ、それは他の単一の米国企業がこれまでに1日で落ちたことの2倍以上です。言い換えれば、それは素晴らしいことではありません。

これまでの同社の対応:DeepseekのR1モデルは「優れたAIの進歩」であることが認められています。

他の米国の株式も減少しています

オランダの会社ASMLなど、他のチップメーカーでも株式が減少しましたが、S&P 500は2%以上減少し、Nasdaqは3.5%減少しました。

多くの専門家が、株式市場のボラティリティがすぐに落ち着くと予測しています。しかし、2023年初頭から非常に高い成長を見たNvidiaのような企業にとって、絶え間ない急な上昇傾向の時代の終わりを告げるかもしれません。

しかし、これは一部のハイテク大手にとって朗報です

それでは、Deepseekがアメリカの次のトップモデルである場合、AIの風景はどのように変化しますか?

メタはおそらくここで大きな勝者です。会社は成功するために安価なAIモデルを必要としています。そして、今では次のお金を節約する進歩がここにあります。

Microsoftはデータセンターでもお金を節約しますが、 Amazonは新しく利用可能なオープンソースモデルを利用できます。

一方、Googleはこれらすべてのデータセンターから最も多くのお金を稼ぐために立っていたでしょう。しかし、巨大なハイテクの巨人が浮かんでいることを何かが教えてくれます。長い目で見れば、安価なオープンソースAIは、米国全体にとって素晴らしいことではない場合でも、ハイテク企業全般にとって依然として良いことです。

米国の5,000億ドルのスターゲートプログラムファクターはどのようになりますか?

Deepseekの混乱は、トランプ大統領からの大きな発表の数日後に起こります。米国政府は、世界のリーダーとして米国を固めることを目的としたOpenai、Softbank、およびOracleとの共同AIベンチャーである「Stargate」に5,000億ドルを沈めます。 AIで。

イニシアチブの計画の中には、米国中の20のデータセンターの建設と、「数十万」の雇用の作成がありますが、後者の主張は、同様の以前の主張の結果に基づいて疑わしいようです。

その目をそらす投資により、米国政府は確かに過剰の戦略の背後にその重みを投げかけているようです。他の国よりも多くの支払いが他のどの国よりも良いAIを提供するという仮定の下で、その問題を解決するために数十億を注ぎます。

今、Deepseekはその論文に穴を開けるために現れました。 DeepSeekが開発予算の10分の1未満で同じ結果を得ることができれば、これらすべての数十億はそのような確実な賭けのようには見えません。

少なくとも今のところ、株式市場は同意しているようです。