近期,AI領(lǐng)域迎來了一場革命性的突破,DeepSeek的V3模型以僅557.6萬的訓(xùn)練成本,展現(xiàn)出了與OpenAI O1推理模型相媲美的性能。這一成就不僅在全球科技界引起了軒然大波,還對英偉達(dá)等芯片巨頭產(chǎn)生了深遠(yuǎn)的影響。1月27日,英偉達(dá)股價暴跌17%,市值瞬間蒸發(fā)6000億美元,市場擔(dān)憂DeepSeek的崛起會減少對先進(jìn)芯片的需求。
然而,科技界對此的看法卻存在分歧。一部分人認(rèn)為,DeepSeek的高性能和低成本將推動整個應(yīng)用生態(tài)的繁榮,對英偉達(dá)等芯片制造商的長期發(fā)展構(gòu)成利好。加州大學(xué)戴維斯分校電子計(jì)算機(jī)工程系助理教授、AIZip聯(lián)合創(chuàng)始人陳羽北指出,DeepSeek的核心創(chuàng)新在于其基礎(chǔ)模型V3的能力,通過GRPO(分組相對策略優(yōu)化)方法,實(shí)現(xiàn)了顯著的性能提升。
在訪談中,陳羽北詳細(xì)解釋了DeepSeek的技術(shù)優(yōu)勢。他認(rèn)為,V3模型在混合專家網(wǎng)絡(luò)(MoE)和注意力層(Attention Layer)上的優(yōu)化,使得模型在600多B的參數(shù)規(guī)模下依然能夠表現(xiàn)出色。而DeepSeek R1 Zero則通過設(shè)計(jì)基于規(guī)則的獎勵函數(shù),利用V3模型生成的大量回答進(jìn)行篩選,從而提高了正確回答的比重。DeepSeek還通過大模型訓(xùn)練小模型的方式,進(jìn)一步提升了小模型在相關(guān)問題上的表現(xiàn)。
對于英偉達(dá)而言,DeepSeek的出現(xiàn)無疑是一把雙刃劍。Inference.ai創(chuàng)始人兼CEO John Yue認(rèn)為,一方面,DeepSeek的成功激發(fā)了更多初創(chuàng)企業(yè)探索AI應(yīng)用層面的可能性,這將帶動整個AI行業(yè)的發(fā)展,從而增加對英偉達(dá)GPU的需求。另一方面,DeepSeek在MOE優(yōu)化和CUDA調(diào)用方面的創(chuàng)新,確實(shí)沖擊了英偉達(dá)的溢價,但并未完全沖垮其NVLink和CUDA兩大壁壘。
John Yue進(jìn)一步解釋稱,MOE的優(yōu)化使得不同專家可以分布在不同的計(jì)算卡上,降低了卡與卡之間互聯(lián)的重要性。而在CUDA調(diào)用方面,DeepSeek團(tuán)隊(duì)已經(jīng)證明可以直接調(diào)用更底層的PTX指令集進(jìn)行優(yōu)化,雖然這并不意味著所有團(tuán)隊(duì)都具備這樣的能力,但至少提供了一種可行的方案。然而,長期來看,英偉達(dá)在CUDA生態(tài)和GPU調(diào)用系統(tǒng)方面的優(yōu)勢依然難以撼動。
DeepSeek選擇開源的策略也對整個AI行業(yè)產(chǎn)生了深遠(yuǎn)影響。John Yue表示,開源降低了AI應(yīng)用的準(zhǔn)入門檻,使得更多開發(fā)者能夠基于DeepSeek模型構(gòu)建自己的應(yīng)用。這不僅有助于推動AI技術(shù)的普及和應(yīng)用創(chuàng)新,還為DeepSeek模型本身提供了更多的反饋和優(yōu)化機(jī)會。
在談到API接口價格時,John Yue指出,DeepSeek通過從上到下的全面優(yōu)化,包括PTX調(diào)用、MOE架構(gòu)和負(fù)載均衡等方面,成功降低了API成本。這使得更多企業(yè)和開發(fā)者能夠承擔(dān)得起AI應(yīng)用的成本,進(jìn)一步推動了AI技術(shù)的普及。
對于未來AI技術(shù)的發(fā)展趨勢,陳羽北認(rèn)為小模型將扮演越來越重要的角色。他指出,隨著小模型在性能上的不斷提升和應(yīng)用場景的不斷拓展,未來AI基礎(chǔ)設(shè)施將呈現(xiàn)出分層化的趨勢。從終端設(shè)備到邊緣端再到云端,不同層級的AI模型將共同構(gòu)成一個完整的智能系統(tǒng)。這將極大地降低AI應(yīng)用的成本和提高AI的普及程度。
然而,陳羽北也提到,盡管小模型在很多領(lǐng)域已經(jīng)展現(xiàn)出了強(qiáng)大的應(yīng)用潛力,但在數(shù)據(jù)構(gòu)成和架構(gòu)創(chuàng)新方面仍然存在諸多挑戰(zhàn)。他呼吁DeepSeek等前沿研究實(shí)驗(yàn)室能夠更多地分享數(shù)據(jù)整理和架構(gòu)創(chuàng)新的細(xì)節(jié),以便其他開發(fā)者能夠更容易地復(fù)現(xiàn)和優(yōu)化這些工作。
總體來看,DeepSeek的崛起不僅推動了AI技術(shù)的進(jìn)步和應(yīng)用創(chuàng)新,還對英偉達(dá)等芯片巨頭產(chǎn)生了深遠(yuǎn)的影響。未來,隨著AI技術(shù)的不斷發(fā)展和應(yīng)用場景的不斷拓展,我們有理由相信AI將深刻改變我們的生活和工作方式。