在人工智能領(lǐng)域的大模型競(jìng)賽邁入第三個(gè)年頭之際,一家源自中國杭州的初創(chuàng)企業(yè)DeepSeek猶如一條活力四射的鯰魚,為全球大模型生態(tài)帶來了前所未有的活力與變革。
自蛇年春節(jié)以來,中國AI行業(yè)掀起了一股競(jìng)相接入DeepSeek的熱潮。在短短一個(gè)多月的時(shí)間里,從芯片制造商、云服務(wù)提供商、算力服務(wù)商、軟件企業(yè)到面向終端用戶的各類硬件廠商,超過百家中國公司已宣布加入DeepSeek的合作伙伴網(wǎng)絡(luò),借助其開源模型的能力,為自身的業(yè)務(wù)發(fā)展開辟了新的想象空間。
DeepSeek無疑極大地推動(dòng)了大模型的普及,但與之俱來的還有一個(gè)更為關(guān)鍵的問題——算力。圍繞這一核心議題,市場(chǎng)態(tài)度經(jīng)歷了多次波動(dòng)。初期,DeepSeek憑借低算力成本的特點(diǎn),一度對(duì)英偉達(dá)等算力廠商造成了股價(jià)沖擊。隨后,隨著訪問用戶的激增和私有化部署需求的增長(zhǎng),算力概念股又強(qiáng)勢(shì)反彈,供不應(yīng)求。最近,DeepSeek還公布了其理論成本和利潤(rùn)率,再次在AI圈內(nèi)引發(fā)了廣泛討論。
隨著DeepSeek合作伙伴網(wǎng)絡(luò)的不斷擴(kuò)大,由OpenAI引發(fā)的芯片硬件側(cè)的軍備競(jìng)賽能否持續(xù)?這場(chǎng)算力游戲又將帶來哪些新的規(guī)則?
DeepSeek以低成本和高性能著稱,根據(jù)官方數(shù)據(jù),每個(gè)H800節(jié)點(diǎn)每秒能處理73.7k/14.8k個(gè)輸入/輸出tokens,理論單日總收入可達(dá)562027美元,成本利潤(rùn)率高達(dá)545%,其“中國式創(chuàng)新”激活了國產(chǎn)算力生態(tài)。
在DeepSeek的合作伙伴中,表現(xiàn)最為積極、行動(dòng)最快的可以分為四類:基礎(chǔ)層(包括國產(chǎn)芯片廠商和云服務(wù)提供商)、中間層(AI基礎(chǔ)設(shè)施廠商)以及在B端和C端的軟硬件廠商。據(jù)不完全統(tǒng)計(jì),第一批接入DeepSeek的企業(yè)已接近百家。
“每天都有十幾個(gè)咨詢,從春節(jié)復(fù)工后就一直沒休息過?!币晃籄I基礎(chǔ)設(shè)施廠商的商務(wù)人員表示。
作為連接大模型底層算力和下游應(yīng)用的中間層,AI基礎(chǔ)設(shè)施廠商既是第一批接住DeepSeek“流量”的玩家,也是第一批受益者。例如,硅基流動(dòng)創(chuàng)始人袁進(jìn)輝在DeepSeek出圈后,迅速與華為合作,完成了DeepSeek-R1和V3在昇騰生態(tài)的適配工作。
與AI基礎(chǔ)設(shè)施廠商同樣敏銳的,還有國產(chǎn)芯片廠商。一位智算中心服務(wù)商表示,此輪DeepSeek熱潮中,國產(chǎn)AI芯片廠商的反應(yīng)速度很快,幾乎與國際玩家如英偉達(dá)同步接入。
緊隨其后的是云服務(wù)提供商和面向終端的軟硬件廠商。云服務(wù)提供商方面,幾乎所有“互聯(lián)網(wǎng)云”都在春節(jié)期間上線了基于DeepSeek模型的API服務(wù),掀起了一輪新的“低API價(jià)格+開源模型”戰(zhàn),云端算力推動(dòng)了DeepSeek在不同行業(yè)的加速滲透。
在硬件方面,手機(jī)廠商是最先擁抱DeepSeek的玩家之一。而在用戶感受最為直觀的軟件應(yīng)用側(cè),包括騰訊在內(nèi)的大廠也攜“超級(jí)應(yīng)用+DeepSeek”卷入競(jìng)爭(zhēng),為大模型競(jìng)賽再添一把火。
在分食DeepSeek流量的背后,不同玩家其實(shí)各有打算。從算力層來看,擁有充足算力儲(chǔ)備的云服務(wù)提供商動(dòng)力更強(qiáng)。它們既是中國算力市場(chǎng)的投資主力,向外大規(guī)模投資固定資產(chǎn),包括采購芯片、服務(wù)器、租賃土地建數(shù)據(jù)中心等,對(duì)內(nèi)也會(huì)自研芯片。
以阿里和百度為例,2024年全年,阿里的資本支出總計(jì)超過724億元,百度超過82億元。據(jù)此前報(bào)道,阿里、字節(jié)跳動(dòng)也早已完成10萬卡級(jí)別的算力儲(chǔ)備。
DeepSeek通過模型壓縮、稀疏計(jì)算、混合精度訓(xùn)練等多種技術(shù)手段,驗(yàn)證了低算力成本復(fù)現(xiàn)高性能模型的可行性,也給自研芯片的大廠帶來了“自供血”機(jī)會(huì)。
“自供血、對(duì)外租賃,云服務(wù)提供商有自己的業(yè)務(wù)閉環(huán)?!币晃恍袠I(yè)專家表示。
在戰(zhàn)略層面,借助自有云業(yè)務(wù),BAT和字節(jié)跳動(dòng)可以通過DeepSeek達(dá)成兩大目的:一是通過DeepSeek這一超級(jí)流量入口,與自身產(chǎn)品協(xié)同,短期承接流量;二是有助于鞭策內(nèi)部團(tuán)隊(duì),在對(duì)比中提升自身模型能力。
DeepSeek的出現(xiàn)改變了大眾對(duì)大模型商業(yè)本質(zhì)的思考。原先,公眾認(rèn)為大模型可能只是一個(gè)用于日常對(duì)話、應(yīng)用辦公的工具,但事實(shí)上,DeepSeek已成為一個(gè)超越互聯(lián)網(wǎng)、甚至超越操作系統(tǒng)的超級(jí)流量入口。
據(jù)Sensor Tower數(shù)據(jù)顯示,截至某日期,DeepSeek移動(dòng)端的日活數(shù)據(jù)已從超過1500萬的峰值下滑至700萬左右。與此同時(shí),其他大模型如元寶、豆包、通義等均實(shí)現(xiàn)了訪問量和日活的大幅增長(zhǎng)。
DeepSeek的模型能力有目共睹,有流量有市場(chǎng),且前期在C端以免費(fèi)模式實(shí)現(xiàn)用戶數(shù)的快速增長(zhǎng),頭部大廠自然會(huì)迅速跟進(jìn)。在中國互聯(lián)網(wǎng)歷史上,像DeepSeek這樣得到全行業(yè)追捧和爭(zhēng)搶接入的產(chǎn)品并不多見。
在應(yīng)用側(cè),DeepSeek以低成本和低功耗支持復(fù)雜AI任務(wù)的運(yùn)行,推動(dòng)了AI進(jìn)一步下沉至智能終端、汽車智能駕駛和產(chǎn)業(yè)側(cè)。手機(jī)廠商如華為、榮耀、OPPO等宣布在AI助手中接入DeepSeek,這有利于它們擴(kuò)充云端AI生態(tài),并有望拉動(dòng)手機(jī)SoC的需求量。
然而,伴隨“接入DeepSeek”浪潮而來的,是服務(wù)器繁忙的提示。從用戶體驗(yàn)來看,服務(wù)器繁忙、延遲加劇等問題日益凸顯。即使是AI基礎(chǔ)設(shè)施廠商也不得不開始限流,尋求更多的算力資源。
那么,這些DeepSeek的合作伙伴們,它們的算力到底夠不夠?行業(yè)目前的共識(shí)是短期算力洗牌,長(zhǎng)期算力短缺。
“短期算力洗牌”指的是DeepSeek打破了過去模型廠商“大力出奇跡”的敘事,通過模型架構(gòu)、預(yù)訓(xùn)練和推理側(cè)的系統(tǒng)級(jí)工程手段,降低了模型部署的算力門檻,短期內(nèi)給國產(chǎn)芯片、算力服務(wù)商等整合國產(chǎn)算力、推動(dòng)國產(chǎn)算力洗牌提供了機(jī)會(huì)。
具體來說,一方面,DeepSeek降低了對(duì)高性能芯片的依賴,給國產(chǎn)芯片提供了更多機(jī)會(huì);另一方面,它解決了部分智算中心算力閑置的困局。一直以來,強(qiáng)勁性能都是英偉達(dá)高端GPU的護(hù)城河,也是起步較晚的國產(chǎn)芯片的一大軟肋。DeepSeek的出現(xiàn)降低了對(duì)高性能芯片的依賴,即使是性能較低的GPU也能勝任DeepSeek的本地化部署需求。
而對(duì)一些部署國產(chǎn)芯片的智算中心而言,DeepSeek出圈也短期解決了算力閑置和碎片化問題。中國智算中心項(xiàng)目已超過600個(gè),各地也在興建千卡、萬卡算力資源池。然而,在過去,由于缺少一個(gè)成本低、性能好且開源的模型,很多算力沒有得到有效利用。
但DeepSeek打破了這一窘境。首先,國產(chǎn)芯片廠商反應(yīng)迅速;其次,作為一個(gè)真正“好的開源大模型”,它帶動(dòng)了上下游生態(tài),疊加政策驅(qū)動(dòng),推動(dòng)了過去閑置的國產(chǎn)算力真正地用起來。
然而,短期洗牌過后,長(zhǎng)期來看,算力還是短缺的。據(jù)IDC數(shù)據(jù),2024年中國智能算力規(guī)模同比增長(zhǎng)74.1%,增幅是同期通用算力增幅的3倍以上。未來智能算力內(nèi)部訓(xùn)練算力占比會(huì)下滑,推理算力占比將上升。
推理算力猛漲的背后,是行業(yè)對(duì)“AI加速滲透千行百業(yè)”的期待。以目前日活量、日均token調(diào)用量為基礎(chǔ)進(jìn)行估算,10億級(jí)別DAU的應(yīng)用接入DeepSeek且全面普及使用后,所需的推理算力規(guī)模巨大。
事實(shí)上,中國科技大廠已經(jīng)進(jìn)入新一輪的擴(kuò)張周期。以阿里為例,近兩年其資本支出呈現(xiàn)出高增趨勢(shì),部分季度甚至呈現(xiàn)三位數(shù)高增。阿里管理層在最新財(cái)報(bào)電話會(huì)中給出的指引是,未來三年在云和AI的基礎(chǔ)設(shè)施投入將超越過去十年的總和。
比起討論“是不是泡沫”,國產(chǎn)算力現(xiàn)階段還有更需要做的事。行業(yè)需要更多的高性價(jià)比算力,支持像DeepSeek這樣有價(jià)值的國產(chǎn)自主創(chuàng)新,并積極復(fù)現(xiàn)其技術(shù)路線,以及在具體業(yè)務(wù)場(chǎng)景中尋找更具性價(jià)比的算力方案。