Apa itu Deepseek? AI baru China sekarang open-source

Diterbitkan: 2025-01-28

Deepseek adalah AI multimodal terbaru.

Secara teknis, Deepseek adalah nama perusahaan Cina yang merilis model. Model saat ini sendiri disebut "R1" dan "V1." Keduanya secara besar -besaran mengguncang seluruh industri AI setelah rilis R1 20 Januari di AS.

Mengapa? Muncul dengan biaya pengembangan yang sangat rendah, ini adalah sumber terbuka untuk penggunaan komersial, dan melemahkan saingan seperti Openai -tepat pada saat pemerintah AS bertaruh lebih berat dari sebelumnya pada kemajuan AI yang ditumbuhkan sendiri.

Apa yang perlu saya ketahui tentang Deepseek?

Deepseek menawarkan beberapa model yang berbeda - R1 dan V3 - selain generator gambar. Hal utama yang perlu diketahui adalah bahwa mereka lebih murah, lebih efisien, dan lebih tersedia secara bebas daripada pesaing teratas, yang berarti bahwa chatgpt Openai mungkin telah kehilangan mahkotanya sebagai lebah ratu dari model AI.

Inilah yang harus diketahui tentang mereka semua.

Deepseek R1

Model Deepseek yang digunakan semua orang saat ini adalah R1.

Tentang Tech.Co Video Thumbnail Menampilkan Penulis Utama Conor Cawley tersenyum di sebelah logo Tech.co Ini baru saja! Melihat
Penawaran Teknologi Bisnis Teratas untuk 2025 👨‍💻
Lihat tombol Daftar

Ini di bagian atas App Store -mengalahkan ChatGPT-dan ini adalah versi yang saat ini tersedia di web dan open-source, dengan API yang tersedia secara bebas. Tidak seperti beberapa model lain yang berbasis di China yang bertujuan untuk bersaing dengan ChatGPT, para ahli AI terkesan dengan kemampuan yang ditawarkan R1.

Seperti yang dikatakan investor teknologi Marc Andreessen beberapa hari yang lalu: "Deepseek R1 adalah salah satu terobosan paling menakjubkan dan mengesankan yang pernah saya lihat - dan sebagai open source, hadiah yang mendalam bagi dunia."

Ini jauh lebih murah untuk beroperasi daripada chatgpt juga: mungkin 20 hingga 50 kali lebih murah.

Ada beberapa keburukan di sekitar jenis chip yang digunakan untuk melatih model Deepseek, dengan beberapa klaim yang tidak berdasar yang menyatakan bahwa perusahaan menggunakan chip A100, yang saat ini dilarang dari ekspor AS ke Cina.

Deepseek v3

Namun, model besar perusahaan lainnya adalah apa yang menakuti Lembah Silikon: Deepseek V3.

Model V3 murah untuk dilatih, jauh lebih murah daripada yang dipikirkan oleh banyak ahli AI: menurut Deepseek, pelatihan hanya membutuhkan waktu 2.788 ribu jam GPU H800, yang menambah hingga $ 5,576 juta , dengan asumsi biaya $ 2 per GPU per jam.

V3 adalah model yang lebih efisien, karena beroperasi pada arsitektur MOE 671b-parameter dengan parameter teraktivasi 37B per token-mengurangi overhead komputasi yang diperlukan oleh chatgpt dan desain parameter 1.8T- nya.

Teks-ke-gambar Generasi: Janus Pro

Plus, ada Janus Pro , generator teks-ke-gambar perusahaan.

Deepseek telah melaporkan bahwa model AI Janus-Pro-7b-nya telah mengungguli Dall-E 3 Openai dan difusi stabil stabilitas AI , menurut peringkat papan peringkat untuk pembuatan gambar menggunakan petunjuk teks.

Menurut perusahaan, model ini dilatih pada "72 juta gambar sintetis berkualitas tinggi."

Deepseek dapat berjalan secara lokal

Satu hal terakhir yang perlu diketahui: Deepseek dapat dijalankan secara lokal , tanpa perlu koneksi internet. Ini adalah bagian dan parsel dengan rilis open-source model: karena kode tersedia di GitHub, dapat diunduh.

Itu menandai peningkatan lain dibandingkan model AI populer seperti Openai, dan-setidaknya bagi mereka yang memilih untuk menjalankan AI secara lokal-itu berarti bahwa tidak ada kemungkinan perusahaan yang berbasis di China mengakses data pengguna.

Sebagai tanggapan, stok Nvidia adalah jalan, jauh ke bawah

Deepseek menandai perombakan besar pada pendekatan populer untuk AI Tech di AS: model AI perusahaan Cina dibangun dengan sebagian kecil dari sumber daya, tetapi mengirimkan barang dan open-source, untuk boot. Respons awal adalah penurunan besar harga saham untuk perusahaan AI terbesar di AS.

Perusahaan chip AI Nvidia melihat penurunan saham terbesar dalam sejarahnya, kehilangan hampir $ 600 miliar dalam nilai pasar saham ketika saham turun 16,86% sebagai tanggapan terhadap Deepseek News.

Seberapa buruk itu? Nah, ini lebih dari dua kali lipat dari perusahaan tunggal AS lainnya yang pernah turun hanya dalam satu hari . Dengan kata lain, itu tidak bagus.

Tanggapan perusahaan sejauh ini: mengakui bahwa model R1 Deepseek adalah "kemajuan AI yang sangat baik."

Saham AS lainnya juga turun

Saham turun di chipmaker lain juga, seperti perusahaan Belanda ASML, sedangkan S&P 500 turun lebih dari 2% dan NASDAQ turun 3,5%.

Banyak ahli memperkirakan bahwa volatilitas pasar saham akan segera tenang. Namun, itu mungkin menandai akhir era untuk tren upward curam yang konstan untuk perusahaan seperti Nvidia, yang telah mengalami pertumbuhan yang sangat tinggi sejak awal 2023.

Tapi ini adalah kabar baik untuk beberapa raksasa teknologi

Jadi, bagaimana perubahan lanskap AI jika Deepseek adalah model top Amerika berikutnya?

Meta kemungkinan merupakan pemenang besar di sini: Perusahaan membutuhkan model AI murah untuk berhasil, dan sekarang kemajuan penghematan uang berikutnya ada di sini.

Microsoft juga akan menghemat uang di pusat data, sementara Amazon dapat memanfaatkan model open source yang baru tersedia.

Google, di sisi lain, akan berdiri untuk menghasilkan uang paling banyak dari semua pusat data tersebut. Namun, sesuatu memberi tahu kita bahwa raksasa teknologi besar akan tetap bertahan. Dalam jangka panjang, AI open-source murah masih baik untuk perusahaan teknologi pada umumnya, bahkan jika itu mungkin tidak bagus untuk AS secara keseluruhan.

Bagaimana faktor program Stargate $ 500 miliar AS?

Gangguan Deepseek datang hanya beberapa hari setelah pengumuman besar dari Presiden Trump: Pemerintah AS akan tenggelam $ 500 miliar ke dalam "Stargate," sebuah usaha AI bersama dengan Openai, Softbank, dan Oracle yang bertujuan untuk memperkuat AS sebagai pemimpin dunia sebagai pemimpin dunia sebagai pemimpin dunia di ai.

Di antara rencana inisiatif adalah pembangunan 20 pusat data di seluruh AS , serta penciptaan "ratusan ribu" pekerjaan, meskipun klaim terakhir tampaknya meragukan, berdasarkan hasil dari klaim yang sama sebelumnya .

Dengan investasi yang menggemparkan mata itu, pemerintah AS tentu saja tampaknya melemparkan bobotnya di balik strategi berlebih: menuangkan miliaran untuk memecahkan masalah AI-nya, dengan asumsi bahwa membayar lebih dari negara lain akan memberikan AI yang lebih baik daripada negara lain.

Sekarang, Deepseek telah muncul untuk menyodok sebuah lubang di tesis itu. Jika Deepseek bisa mendapatkan hasil yang sama dengan kurang dari sepersepuluh dari anggaran pengembangan, semua miliaran itu tidak terlihat seperti taruhan yang pasti.

Pasar saham - untuk saat ini, setidaknya - tampaknya setuju.