Deepseek คืออะไร? AI ใหม่ของจีนตอนนี้เปิดแหล่งที่มา
เผยแพร่แล้ว: 2025-01-28Deepseek เป็น AI หลายรูปแบบล่าสุด
ในทางเทคนิค Deepseek เป็นชื่อของ บริษัท จีนที่ปล่อยโมเดล โมเดลปัจจุบันตัวเองเรียกว่า "R1" และ "v1" ทั้งสองกำลังสั่นคลอนอย่างมากในอุตสาหกรรม AI ทั้งหมดหลังจากการเปิดตัวในวันที่ 20 มกราคมของ R1 ในสหรัฐอเมริกา
ทำไม มันมาพร้อมกับค่าใช้จ่ายในการพัฒนาที่ต่ำมากมันเป็นแหล่งโอเพ่นซอร์ส สำหรับ การใช้งานเชิงพาณิชย์และมันตัดราคาคู่แข่งเช่น Openai- ในเวลาที่รัฐบาลสหรัฐฯได้เดิมพันมากขึ้นกว่าเดิม
ฉันต้องรู้อะไรเกี่ยวกับ Deepseek?
Deepseek นำเสนอรุ่นที่แตกต่างกันสองแบบ - R1 และ V3 - นอกเหนือจากเครื่องกำเนิดภาพ สิ่งสำคัญที่ควรทราบคือพวกเขาถูกกว่ามีประสิทธิภาพมากขึ้นและมีให้บริการได้อย่างอิสระมากกว่าคู่แข่งชั้นนำซึ่งหมายความว่าผู้พูดคุยของ Openai อาจสูญเสียมงกุฎในฐานะ Queen Bee of AI รุ่น
นี่คือสิ่งที่ต้องรู้เกี่ยวกับพวกเขาทั้งหมด
Deepseek R1
โมเดล Deepseek ที่ทุกคนใช้อยู่ตอนนี้คือ R1
เพียงแค่ใน! ดู
ข้อตกลงด้านเทคโนโลยีธุรกิจชั้นนำสำหรับปี 2025 👨💻
มันอยู่ที่ ด้านบนสุดของ App Store- เอาชนะ CHATGPT-และเป็นเวอร์ชันที่ มีอยู่ในเว็บ และโอเพ่นซอร์สในปัจจุบันพร้อม API พร้อมใช้งานได้อย่างอิสระ ซึ่งแตกต่างจากรุ่นอื่น ๆ ในประเทศจีนที่มีจุดประสงค์เพื่อแข่งขันกับ CHATGPT ผู้เชี่ยวชาญ AI รู้สึกประทับใจกับความสามารถที่ R1 เสนอ
ในฐานะนักลงทุนด้านเทคโนโลยีที่มีอิทธิพล Marc Andreessen วางไว้เมื่อไม่กี่วันก่อน:“ Deepseek R1 เป็นหนึ่งในความก้าวหน้าที่น่าทึ่งและน่าประทับใจที่สุดที่ฉันเคยเห็น - และในฐานะโอเพ่นซอร์สซึ่งเป็นของขวัญที่ลึกซึ้งสู่โลก”
มันถูกกว่าในการทำงานมากกว่า CHATGPT ด้วย: อาจจะถูกกว่า 20 ถึง 50 เท่า
มีบางส่วนที่อยู่รอบ ๆ ชิปที่ใช้ในการฝึกอบรมแบบจำลองของ Deepseek โดยมีการเรียกร้องที่ไม่มีเงื่อนไขบางอย่างระบุว่า บริษัท ใช้ A100 ชิปซึ่งปัจจุบันถูกแบนจากการส่งออกของสหรัฐไปยังประเทศจีน
deepseek v3
อย่างไรก็ตามรุ่นใหญ่อื่น ๆ ของ บริษัท คือสิ่งที่ทำให้ Silicon Valley กลัว: Deepseek V3
โมเดล V3 ราคาถูกในการฝึกอบรมราคาถูกกว่าผู้เชี่ยวชาญ AI หลายคนคิดว่าเป็นไปได้: ตาม Deepseek การฝึกอบรมใช้เวลาเพียง 2,788,000 H800 GPU ชั่วโมงซึ่งเพิ่มขึ้นเพียง 5.576 ล้านดอลลาร์ โดยสมมติว่า $ 2 ต่อ GPU ต่อชั่วโมง

V3 เป็นแบบจำลองที่มีประสิทธิภาพมากขึ้นเนื่องจากมันทำงานบน สถาปัตยกรรม MOE 671b-parameter ที่มีพารามิเตอร์เปิดใช้งาน 37B ต่อโทเค็น-ลดค่าใช้จ่ายในการคำนวณที่ต้องการโดย CHATGPT และ การออกแบบ 1.8T-parameter
การสร้างข้อความเป็นภาพ: Janus Pro
นอกจากนี้ยังมี Janus Pro ซึ่งเป็นเครื่องกำเนิดข้อความถึงภาพของ บริษัท
Deepseek ได้รายงานว่าโมเดล Janus-Pro-7b AI นั้นมี ประสิทธิภาพสูงกว่า Dall-E 3 ของ OpenAi และการแพร่กระจายที่มั่นคงของ AI ตามการจัดอันดับลีดเดอร์บอร์ดสำหรับการสร้างภาพโดยใช้ข้อความแจ้ง
จากข้อมูลของ บริษัท โมเดลนี้ได้รับการฝึกฝนเกี่ยวกับ“ ภาพสังเคราะห์คุณภาพสูง 72 ล้านภาพ”
Deepseek สามารถทำงานได้ในท้องถิ่น
สิ่งสุดท้ายที่ควรทราบ: Deepseek สามารถทำงานได้ในพื้นที่ โดยไม่จำเป็นต้องมีการเชื่อมต่ออินเทอร์เน็ต นี่คือส่วนหนึ่งและพัสดุพร้อมการเปิดตัวโอเพนซอร์ซของรุ่น: เนื่องจากรหัสมีอยู่ใน GitHub จึงสามารถดาวน์โหลดได้
นั่นเป็นการปรับปรุงอีกครั้งเกี่ยวกับโมเดล AI ยอดนิยมเช่น Openai และอย่างน้อยสำหรับผู้ที่เลือกที่จะเรียกใช้ AI ในพื้นที่-หมายความว่าไม่มีความเป็นไปได้ที่ บริษัท ที่อยู่ในประเทศจีนจะเข้าถึงข้อมูลผู้ใช้
ในการตอบสนองหุ้นของ Nvidia คือวิธีลง
Deepseek นับเป็นวิธีการที่ยอดเยี่ยมสำหรับวิธีการที่ได้รับความนิยมในการใช้เทคโนโลยี AI ในสหรัฐอเมริกา: โมเดล AI ของ บริษัท จีนถูกสร้างขึ้นด้วยทรัพยากรเพียงเล็กน้อย แต่ส่งมอบสินค้าและโอเพนซอร์ซเพื่อบูต การตอบสนองครั้งแรกคือราคาหุ้นที่ลดลงอย่างมากสำหรับ บริษัท AI ที่ใหญ่ที่สุดในสหรัฐอเมริกา
บริษัท ชิป AI Nvidia เห็นหุ้นที่ใหญ่ที่สุดลดลงในประวัติศาสตร์ของมัน สูญเสียมูลค่าเกือบ 600 พันล้านดอลลาร์ในมูลค่าตลาดหุ้นเมื่อหุ้นลดลง 16.86% ในการตอบสนองต่อข่าว Deepseek
มันแย่แค่ไหน? มันเป็นมากกว่า สองเท่าของ บริษัท เดี่ยวอื่น ๆ ที่สหรัฐฯเคยลดลงในวันเดียว กล่าวอีกนัยหนึ่งมันไม่ดี
การตอบสนองของ บริษัท จนถึงตอนนี้: เป็นที่ยอมรับว่าโมเดล R1 ของ Deepseek นั้นเป็น“ ความก้าวหน้าของ AI ที่ยอดเยี่ยม”
หุ้นสหรัฐอื่น ๆ ก็ลดลงเช่นกัน
หุ้นลดลงที่ผู้ผลิตชิปรายอื่นเช่น ASML บริษัท ดัตช์ในขณะที่ S&P 500 ลดลงมากกว่า 2% และ Nasdaq ลดลง 3.5%
ผู้เชี่ยวชาญจำนวนมากคาดการณ์ว่าความผันผวนของตลาดหุ้นจะสงบลงในไม่ช้า อย่างไรก็ตามมันอาจเป็นจุดสิ้นสุดของยุคสำหรับแนวโน้มที่สูงชันอย่างต่อเนื่องสำหรับ บริษัท อย่าง Nvidia ซึ่งได้เห็นการเติบโตที่สูงอย่างไม่น่าเชื่อตั้งแต่ต้นปี 2023
แต่นี่เป็นข่าวดีสำหรับยักษ์ใหญ่ด้านเทคโนโลยี
ดังนั้นภูมิทัศน์ AI จะเปลี่ยนไปอย่างไรหาก Deepseek เป็นนางแบบอันดับต้น ๆ ของอเมริกา
Meta น่าจะเป็นผู้ชนะที่ยิ่งใหญ่ที่นี่: บริษัท ต้องการโมเดล AI ราคาถูกเพื่อที่จะประสบความสำเร็จและตอนนี้ความก้าวหน้าในการประหยัดเงินครั้งต่อไปอยู่ที่นี่
Microsoft จะประหยัดเงินในศูนย์ข้อมูลในขณะที่ Amazon สามารถใช้ประโยชน์จากโมเดลโอเพนซอร์สที่มีอยู่ใหม่
ในทางกลับกัน Google จะได้รับเงินมากที่สุดจากศูนย์ข้อมูลทั้งหมด มีบางอย่างบอกเราว่ายักษ์ใหญ่ด้านเทคโนโลยีขนาดใหญ่จะยังคงลอยอยู่ ในระยะยาว AI โอเพ่นซอร์สราคาถูกยังคงดีสำหรับ บริษัท เทคโนโลยีโดยทั่วไปแม้ว่ามันอาจจะไม่ดีสำหรับสหรัฐอเมริกาโดยรวม
โปรแกรม Stargate ของสหรัฐฯมูลค่า 500 พันล้านดอลลาร์ในสหรัฐอเมริกาเป็นอย่างไร?
การหยุดชะงักของ Deepseek เกิดขึ้นเพียงไม่กี่วันหลังจากการประกาศครั้งใหญ่จากประธานาธิบดีทรัมป์: รัฐบาลสหรัฐฯจะลดลง 500 พันล้านเหรียญสหรัฐใน“ Stargate” ร่วมกับ Openai, Softbank และ Oracle ที่มุ่งมั่นที่จะทำให้สหรัฐฯเป็นผู้นำระดับโลก ใน ai.
ในบรรดาแผนการของความคิดริเริ่มคือ การก่อสร้างศูนย์ข้อมูล 20 แห่งทั่วสหรัฐอเมริกา รวมถึงการสร้างงาน“ หลายแสนคน” แม้ว่าการเรียกร้องครั้งหลังดูเหมือนจะน่าสงสัยตามผลลัพธ์ของ การเรียกร้องก่อนหน้านี้ที่คล้ายกัน
ด้วยการลงทุนที่น่าดึงดูดใจรัฐบาลสหรัฐฯดูเหมือนจะทิ้งน้ำหนักไว้เบื้องหลังกลยุทธ์ที่เกินกว่า: การหลั่งไหลหลายพันล้านในการแก้ปัญหา AI ภายใต้สมมติฐานที่ว่าการจ่ายเงินมากกว่าประเทศอื่น ๆ จะส่งมอบ AI ที่ดีกว่าประเทศอื่น ๆ
ตอนนี้ Deepseek ได้โผล่ออกมาเพื่อเจาะรูในวิทยานิพนธ์นั้น หาก Deepseek ได้รับผลลัพธ์ที่เหมือนกันน้อยกว่าหนึ่งในสิบของงบประมาณการพัฒนาเงินพันล้านเหล่านั้นไม่เหมือนการเดิมพันที่แน่นอน
ตลาดหุ้น - อย่างน้อยตอนนี้ - ดูเหมือนว่าจะเห็นด้วย