近日,中國(guó)創(chuàng)業(yè)公司DeepSeek因其在人工智能領(lǐng)域的巨額投入引發(fā)了廣泛關(guān)注和股市波動(dòng)。據(jù)知名研究機(jī)構(gòu)SemiAnalysis的最新報(bào)告揭示,DeepSeek在硬件繪圖處理器(GPU)上的支出已超過(guò)5億美元大關(guān)。
DeepSeek的背后推手是中國(guó)對(duì)沖基金幻方量化(High-Flyer)。據(jù)悉,幻方量化于2023年5月正式成立了DeepSeek,旨在加速AI技術(shù)的研發(fā)進(jìn)程。值得注意的是,早在2021年,即任何出口管制措施生效之前,幻方量化已前瞻性地投資購(gòu)入了一萬(wàn)顆英偉達(dá)(Nvidia)A100 GPU,為DeepSeek的后續(xù)發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。
SemiAnalysis的報(bào)告進(jìn)一步指出,DeepSeek在GPU方面的投資之巨,遠(yuǎn)超公眾想象。而英偉達(dá)方面,為了遵守相關(guān)法規(guī),已推出了多款H100的變種產(chǎn)品,如H800、H20等。然而,目前僅有H20型號(hào)被允許銷(xiāo)售至中國(guó)市場(chǎng)。在過(guò)去九個(gè)月里,英偉達(dá)專(zhuān)門(mén)為中國(guó)市場(chǎng)生產(chǎn)了超過(guò)百萬(wàn)顆H20 GPU。據(jù)分析,DeepSeek在服務(wù)器資本支出(CapEx)方面的總投入已接近16億美元。
DeepSeek不僅在硬件上投入巨大,同時(shí)在人才引進(jìn)方面也動(dòng)作頻頻。公司從中國(guó)本土招募了大量?jī)?yōu)秀人才,目前團(tuán)隊(duì)規(guī)模已迅速擴(kuò)張至約150人。近期,DeepSeek因模型訓(xùn)練成本低于600萬(wàn)美元的說(shuō)法而引發(fā)業(yè)界熱議。然而,SemiAnalysis的報(bào)告強(qiáng)調(diào),這600萬(wàn)美元僅指預(yù)訓(xùn)練運(yùn)行的GPU成本,遠(yuǎn)非模型總成本的全部。研發(fā)(R&D)、硬件總擁有成本(Total Cost of Ownership)等關(guān)鍵因素均未計(jì)入其中。
報(bào)告還提及了DeepSeek獲得大量算力資源與出口管制及時(shí)間滯后效應(yīng)之間的關(guān)聯(lián)。美國(guó)智庫(kù)蘭德公司(RAND)研究員海姆(Lennart Heim)近期分析指出,硬件出口管制存在時(shí)間滯后,其影響力尚未完全顯現(xiàn)。未來(lái),當(dāng)數(shù)據(jù)中心需要升級(jí)或擴(kuò)展時(shí),美國(guó)企業(yè)將相對(duì)容易應(yīng)對(duì),而對(duì)于受出口管制影響的中國(guó)企業(yè)來(lái)說(shuō),這將是一個(gè)嚴(yán)峻挑戰(zhàn)。
盡管面臨諸多挑戰(zhàn),DeepSeek在人工智能領(lǐng)域的表現(xiàn)卻令人矚目。SemiAnalysis評(píng)價(jià)稱(chēng),DeepSeek開(kāi)放的權(quán)重模型在性能上超越了meta的Llama、法國(guó)人工智能創(chuàng)業(yè)公司Mistral AI等競(jìng)爭(zhēng)對(duì)手,展現(xiàn)出強(qiáng)大的競(jìng)爭(zhēng)力。
DeepSeek的成功不僅體現(xiàn)在技術(shù)上,更在于其對(duì)于未來(lái)趨勢(shì)的敏銳洞察和果斷行動(dòng)。面對(duì)出口管制等外部壓力,DeepSeek通過(guò)提前布局、加大投入等策略,確保了自身在人工智能領(lǐng)域的領(lǐng)先地位。