>  訊息 >  DeepSeek AI 重大突破:16 億美元投資推動創新

DeepSeek AI 重大突破:16 億美元投資推動創新

Authore: Jacob更新:Sep 08,2025

然而,它的成本效益仍優於競爭對手。

深度求索(DeepSeek)的最新AI助手以這句大膽宣言介紹自己:

嗨,我是為了以出乎意料的洞察力回答任意問題而打造的。

深度求索的AI已成為業界的強大競爭者,甚至影響到NVIDIA股價的顯著下跌。

DeepSeek Test圖片來源:ensigame.com

該模型的實力源自其獨特的架構與先進訓練技術,整合多項尖端創新:

多token預測(MTP):並非逐個字詞預測,而是透過分析句子片段一次預測多個詞彙,提升準確性和速度。
專家混合系統(MoE):運用多個神經網路處理數據,增強訓練效率與性能。DeepSeek V3 使用256個神經網路,並在每個token任務啟動其中8個進行處理。
多頭潛在注意力機制(MLA):聚焦關鍵句子元素,反覆提取重要細節,減少遺漏並捕捉數據中的細微差異。

中國新創公司深度求索聲稱,其強大的DeepSeek V3模型僅以600萬美元預算開發,僅動用2048張GPU。

DeepSeek V3圖片來源:ensigame.com

然而,SemiAnalysis分析師揭露深度求索實際配備龐大基礎設施,包含約5萬張NVIDIA Hopper架構GPU,其中包括1萬張H800、1萬張先進H100及部分H20單元。這些資源分散於多個數據中心,支援AI訓練、研究與金融建模。

公司伺服器投資總額約16億美元,運營成本逼近9.44億美元。

深度求索原屬中國對沖基金高瓴旗下,於2023年分拆專注AI發展。與多數依賴雲端運算的新創不同,深度求索擁有自家數據中心,能更有效控制模型優化與加速創新。其自籌資金結構也強化決策彈性。

DeepSeek圖片來源:ensigame.com

深度求索亦吸引頂尖人才,部分研究人員年薪超過130萬美元,團隊均來自中國頂尖高校。

儘管宣稱訓練DeepSeek V3僅耗資600萬美元,此數字僅涵蓋預訓練階段的GPU使用成本,未包含研究、精修、數據處理與基礎建設支出。

自創立以來,深度求索已投入超過5億美元於AI開發。其精簡架構相比大型官僚競爭對手,更能快速推動高效創新。

DeepSeek圖片來源:ensigame.com

深度求索的崛起證明,資金充足的獨立AI公司能與業界巨頭抗衡。專家指出,其成功奠基於雄厚投資、技術突破與優秀團隊,但「低成本」AI模型的說法仍有誇大之嫌。

不過相較競爭對手,深度求索的成本確實顯著較低。例如其R1模型訓練費用為500萬美元,而ChatGPT4o則耗資1億美元。