在DeepSeek模型的熱潮推動下,國內(nèi)GPU廠商紛紛投身適配大軍,一場圍繞大模型適配的技術(shù)競賽悄然拉開序幕。盡管表面上動作相似,但背后卻隱藏著各家公司的不同戰(zhàn)略與技術(shù)路徑。
適配DeepSeek模型,對于芯片廠商而言,并非簡單的“拿來主義”。從適配策略上看,主要分為兩大陣營:一部分廠商選擇直接適配DeepSeek R1和V3原版模型,這些模型以其強大的推理能力和廣泛的通用性著稱,但也對芯片的計算性能和內(nèi)存帶寬提出了極高要求;另一部分廠商則另辟蹊徑,選擇適配由R1蒸餾而來的小模型,這些小模型結(jié)構(gòu)精簡,參數(shù)量少,更適合輕量級部署和資源受限場景。
在適配DeepSeek的廠商中,華為昇騰、海光信息等巨頭憑借強大的技術(shù)實力和生態(tài)優(yōu)勢,明確宣布適配DeepSeek R1及V3原版模型。這些模型對芯片的計算能力提出了嚴峻挑戰(zhàn),但華為昇騰憑借其在AI訓練和推理方面的優(yōu)化,以及CANN異構(gòu)計算架構(gòu)和MindSpore框架的深度綁定,展現(xiàn)出了極強的適配潛力。海光信息則依托其兼容通用的“類CUDA”環(huán)境和高性能計算能力,在智算中心和HPC+AI融合場景中具有顯著優(yōu)勢。
與此同時,摩爾線程、壁仞科技等廠商則主要支持DeepSeek-R1系列蒸餾模型。這些模型基于通義千問和LLAMA等原始模型蒸餾而來,因此原本能夠支持這些模型的平臺,基本上就能適配DeepSeek的蒸餾模型。這一策略降低了適配難度,加快了產(chǎn)品上市速度。
除了適配模型類型的差異,各家廠商在技術(shù)路線和遇到的挑戰(zhàn)上也有所不同。DeepSeek模型的運行和適配主要依賴于英偉達的硬件和編程語言,這對其他硬件平臺的應(yīng)用和性能構(gòu)成了一定障礙。因此,是否容易適配基于英偉達GPU開發(fā)的DeepSeek等大模型,與芯片是否兼容CUDA密切相關(guān)。能兼容CUDA的廠商,在適配過程中具有天然優(yōu)勢,但彼此間的兼容程度也有所不同。
在性能表現(xiàn)方面,不同GPU的計算能力和內(nèi)存帶寬直接影響DeepSeek在處理大規(guī)模深度學習任務(wù)時的速度。某些GPU在能效比上表現(xiàn)更優(yōu),更適合在低功耗環(huán)境下運行DeepSeek。這要求芯片廠商在追求高性能的同時,也要注重能效比的優(yōu)化。
隨著DeepSeek系列模型的廣泛應(yīng)用,商用化成為關(guān)注的焦點。云上部署和本地化部署成為兩種主要的商用模式。云上部署通過云服務(wù)提供商的平臺,使企業(yè)客戶能夠通過API調(diào)用或云服務(wù)直接使用DeepSeek的功能,降低了前期投入成本。而本地化部署則包括一體機形式和企業(yè)自行部署,主要面向?qū)?shù)據(jù)安全、數(shù)據(jù)隱私較為敏感或?qū)π阅芤髽O高的企業(yè)用戶。
在DeepSeek的商業(yè)化進程中,昇騰和海光信息取得了顯著進展。昇騰憑借其在DeepSeek一體機市場的領(lǐng)先地位,吸引了眾多企業(yè)基于其產(chǎn)品進行適配和上線。而海光信息則通過與青云科技、中科金財?shù)绕髽I(yè)的合作,將DeepSeek模型應(yīng)用于智算中心、金融、智能制造等多個核心場景,展現(xiàn)了其廣泛的應(yīng)用前景。
DeepSeek模型的火熱也帶動了國產(chǎn)芯片需求的顯著增加。隨著海外芯片算力限制帶來的挑戰(zhàn)日益嚴峻,全球算力可能會形成兩條并行路線。在國內(nèi)市場,英偉達和國產(chǎn)芯片將共同承擔預(yù)訓練和后訓練的算力需求。對于國產(chǎn)芯片廠商而言,這既是挑戰(zhàn)也是機遇。他們需要不斷完善互聯(lián)和生態(tài)等方面,以更好地適應(yīng)市場需求。
DeepSeek模型的推廣還促進了AI應(yīng)用市場的爆發(fā)。芯片廠商將目光轉(zhuǎn)向AI應(yīng)用所需的推理算力,推動了國產(chǎn)芯片在推理市場的發(fā)展。隨著國內(nèi)評測芯片時逐漸關(guān)注推理性能,國產(chǎn)芯片在推理市場的機會將更加廣闊。
在DeepSeek的推動下,國產(chǎn)GPU廠商正迎來前所未有的發(fā)展機遇。他們需要在技術(shù)路線、性能優(yōu)化、生態(tài)建設(shè)等方面不斷努力,以更好地滿足市場需求,實現(xiàn)自身的快速發(fā)展。