Cos'è DeepSeek? La nuova AI della Cina è ora open source
Pubblicato: 2025-01-28DeepSeek è l'ultima intelligenza artificiale multimodale.
Tecnicamente, DeepSeek è il nome della società cinese che rilascia i modelli. Gli stessi modelli attuali sono chiamati "R1" e "V1". Entrambi stanno scuotendo enormemente l'intera industria dell'intelligenza artificiale dopo l'uscita del 20 gennaio di R1 negli Stati Uniti.
Perché? Viene fornito con costi di sviluppo molto bassi, è open-source per uso commerciale e sottolinea i rivali come Openai -proprio in un momento in cui il governo degli Stati Uniti ha scommesso più che mai sui suoi progressi di AI coltivati in casa .
Cosa devo sapere su DeepSeek?
DeepSeek offre un paio di modelli diversi - R1 e V3 - oltre a un generatore di immagini. La cosa fondamentale da sapere è che sono più economici, più efficienti e più disponibili rispetto ai migliori concorrenti, il che significa che il chatgpt di Openai potrebbe aver perso la sua corona come ape regina dei modelli AI.
Ecco cosa sapere di tutti loro.
DeepSeek R1
Il modello DeepSeek che tutti stanno usando in questo momento è R1.
Questo è solo dentro! Visualizzazione
Le migliori offerte di tecnologia aziendale per il 2025 👨💻
È in cima all'App Store -battere Chatgpt-ed è la versione che è attualmente disponibile sul Web e Open-Source, con un'API liberamente disponibile. A differenza di altri modelli basati in Cina che mirano a competere con CHATGPT, gli esperti di intelligenza artificiale sono colpiti dalla capacità offerta da R1.
Come ha detto un influente investitore tecnologico Marc Andreessen: "Deepseek R1 è una delle scoperte più sorprendenti e impressionanti che abbia mai visto - e come open source, un dono profondo per il mondo".
È anche più economico operare anche di Chatgpt: forse 20-50 volte più economico.
C'è un po 'di oscurità che circonda il tipo di chip utilizzato per addestrare i modelli di Deepseek, con alcune affermazioni non comprovate che affermano che la società ha utilizzato chip A100, che sono attualmente vietati dall'esportazione statunitense in Cina.
DeepSeek V3
Tuttavia, l'altro grande modello dell'azienda è ciò che spaventa la Silicon Valley: Deepseek V3.
Il modello V3 era economico da allenarsi, molto più economico di quanto molti esperti di intelligenza artificiale avessero pensato possibile: secondo DeepSeek, l'allenamento ha richiesto solo 2.788 mila ore H800 GPU, che aggiunge fino a soli $ 5,576 milioni , assumendo un costo di $ 2 per GPU all'ora.
V3 è un modello più efficiente, poiché opera su un'architettura MOE da 671b-parametro con parametri attivati 37B per token-riducendo le spese generali computazionali richieste da CHATGPT e dal suo design di parametro da 1,8 t .

Generazione di testo-immagine: Janus Pro
Inoltre, c'è Janus Pro , il generatore di testo-immagine dell'azienda.
DeepSeek ha riferito che il suo modello AI di Janus-Pro-7B ha sovraperformato Dall-E 3 di Openi e la diffusione stabile di AI di stabilità , secondo una classifica di classifica per la generazione di immagini utilizzando i prompt di testo.
Secondo la società, questo modello è stato addestrato su "72 milioni di immagini sintetiche di alta qualità".
DeepSeek può funzionare a livello locale
Un'ultima cosa da sapere: DeepSeek può essere eseguito a livello locale , senza bisogno di una connessione Internet. Questo è parte integrante con la versione open source del modello: poiché il codice è disponibile su GitHub, può essere scaricato.
Ciò segna un altro miglioramento rispetto ai popolari modelli di intelligenza artificiale come OpenAI e-almeno per coloro che hanno scelto di gestire l'IA a livello locale-significa che non è possibile che la società con sede in Cina acceda ai dati degli utenti.
In risposta, lo stock di Nvidia è molto verso il basso
DeepSeek segna un grande shakeup all'approccio popolare alla tecnologia AI negli Stati Uniti: i modelli AI della società cinese sono stati costruiti con una frazione delle risorse, ma hanno consegnato la merce e sono open-source, per l'avvio. La risposta iniziale è stata un grande calo dei prezzi delle azioni per le più grandi società di intelligenza artificiale statunitense.
La società di AI Chip Nvidia ha visto il più grande calo delle azioni della sua storia, perdendo quasi $ 600 miliardi di valore del mercato azionario quando le azioni sono diminuite del 16,86% in risposta alle notizie di Deepseek.
Quanto è grave? Bene, è più del doppio di qualsiasi altra società statunitense mai caduta in un solo giorno . In altre parole, non è eccezionale.
La risposta dell'azienda finora: è ammesso che il modello R1 di Deepseek è "un eccellente avanzamento di intelligenza artificiale".
Anche altre azioni statunitensi sono in calo
Le azioni sono diminuite anche su altri chipmakers, come la società olandese ASML, mentre l'S & P 500 è sceso di più del 2% e NASDAQ è sceso del 3,5%.
Molti esperti prevedono che la volatilità del mercato azionario si stabilirà presto. Tuttavia, potrebbe segnare la fine di un'era per la costante tendenza al rialzo per aziende come Nvidia, che aveva visto una crescita incredibilmente elevata dall'inizio del 2023.
Ma questa è una buona notizia per alcuni giganti della tecnologia
Quindi, come cambia il panorama dell'IA se DeepSeek è il prossimo modello di top americano?
Meta è probabilmente un grande vincitore qui: l'azienda ha bisogno di modelli AI economici per avere successo, e ora il prossimo progresso per risparmiare denaro è qui.
Microsoft risparmierà inoltre denaro sui data center, mentre Amazon può sfruttare i modelli open source appena disponibili.
Google, d'altra parte, si sarebbe fermato a fare il maggior numero di soldi da tutti quei data center. Qualcosa ci dice che il enorme gigante tecnologico rimarrà a galla. A lungo termine, l'intelligenza artificiale open source a buon mercato è ancora buona per le aziende tecnologiche in generale, anche se potrebbe non essere eccezionale per gli Stati Uniti nel complesso.
In che modo il programma stargate da $ 500 miliardi statunitensi fatica?
L'interruzione di DeepSeek arriva pochi giorni dopo un grande annuncio del presidente Trump: il governo degli Stati Uniti affonderà $ 500 miliardi in "Stargate", un'impresa congiunta di intelligenza artificiale con Openai, Softbank e Oracle che mira a consolidare gli Stati Uniti come leader mondiale in AI.
Tra i piani dell'iniziativa ci sono la costruzione di 20 data center negli Stati Uniti , così come la creazione di "centinaia di migliaia" di posti di lavoro, sebbene quest'ultima affermazione sembri dubbiosa, basata sul risultato di premesse precedenti simili .
Con quell'investimento per guasti agli occhi, il governo degli Stati Uniti sembra certamente gettare il suo peso dietro una strategia di eccesso: riversare miliardi nella risoluzione dei suoi problemi di intelligenza artificiale, supponendo che il pagamento di più di qualsiasi altro paese fornirà AI migliore di qualsiasi altro paese.
Ora, Deepseek è emerso per colpire un buco in quella tesi. Se DeepSeek può ottenere gli stessi risultati con meno di un decimo del budget per lo sviluppo, tutti questi miliardi non sembrano una scommessa così sicura.
Il mercato azionario - per ora, almeno - sembra essere d'accordo.