在AI領(lǐng)域,英偉達一直被視為行業(yè)的領(lǐng)頭羊,但2025年,這一地位似乎正面臨前所未有的挑戰(zhàn)。隨著AI算力市場風向的轉(zhuǎn)變,行業(yè)重心逐漸從模型訓(xùn)練向模型推理傾斜,一系列專注于推理芯片的初創(chuàng)公司如雨后春筍般涌現(xiàn),它們紛紛向英偉達這位霸主發(fā)起沖擊。
推理與訓(xùn)練,如同AI領(lǐng)域的兩個重要階段,前者是后者的商業(yè)化延伸。訓(xùn)練階段,模型如同初學(xué)者,在教練的指導(dǎo)下不斷學(xué)習和調(diào)整;而推理階段,模型則如同老司機,需靈活應(yīng)對各種實際路況。這一轉(zhuǎn)變意味著,AI工作負載的格局將發(fā)生深刻變化,推理計算需求將迅速提升,甚至有望超過訓(xùn)練計算需求。
在這場挑戰(zhàn)者聯(lián)盟中,Groq、SambaNova和Positron AI無疑是最為引人注目的三位成員。Groq由前谷歌TPU核心團隊的核心成員創(chuàng)辦,其AI推理引擎LPU以其超快的推理速度和遠低于GPU的token成本而聞名。Groq的LPU設(shè)計獨特,旨在解決傳統(tǒng)架構(gòu)中外部內(nèi)存的瓶頸,通過優(yōu)化數(shù)據(jù)流動,實現(xiàn)高效計算。然而,盡管Groq聲稱其LPU在速度和能效上遠超英偉達GPU,但一些專家對其實際成本和能耗提出了質(zhì)疑。
SambaNova則以50億美元的估值位居AI芯片初創(chuàng)公司榜首。其RDU架構(gòu)結(jié)合了GPU的數(shù)倍片上SRAM和適用于大規(guī)模計算任務(wù)的HBM,實現(xiàn)了極致的算子融合和高性能。SambaNova不僅出售芯片,還提供從芯片到服務(wù)器系統(tǒng),甚至包括部署大模型的定制技術(shù)堆棧。其聯(lián)創(chuàng)Rodrigo Liang認為,大模型與生成式AI商業(yè)化的下一個戰(zhàn)場將是企業(yè)的私有數(shù)據(jù),SambaNova的技術(shù)將幫助企業(yè)高效、可持續(xù)地擴展規(guī)模。
相比之下,Positron AI雖然成立時間較短,但其推出的推理芯片同樣引人注目。Positron聲稱其芯片可以執(zhí)行與英偉達H100相同的計算,但成本僅為五分之一。Positron的CEO Thomas Sohmers表示,AI計算開支的重心已經(jīng)轉(zhuǎn)向推理,他們有信心通過提供更多專用于推理的計算資源,推動AI技術(shù)的廣泛采用。
面對這些來勢洶洶的挑戰(zhàn)者,英偉達似乎并未感到過多的壓力。相反,它正忙著推出新的推理芯片B300系列,以更高的算力和更大的顯存滿足市場對大模型推理性能的需求。B300系列將有效降低推理成本,提高模型能力,為AI推理市場注入新的活力。
然而,無論如何,這場由推理芯片引發(fā)的挑戰(zhàn)已經(jīng)讓AI市場變得更加多元化和競爭激烈。對于初創(chuàng)公司而言,它們需要不斷優(yōu)化技術(shù),降低成本,以在市場中站穩(wěn)腳跟;而對于英偉達這樣的行業(yè)巨頭而言,它也需要時刻保持警惕,不斷創(chuàng)新,以應(yīng)對來自四面八方的挑戰(zhàn)。