DeepSeek攪局，算力需求預(yù)期降，AI競賽迎來新變數(shù)？

發(fā)布時間：2025-02-06 12:14 來源：鈦媒體APP 作者：柳晴雪

在人工智能領(lǐng)域，一場由DeepSeek引發(fā)的風暴正席卷全球。這家中國初創(chuàng)公司憑借其開源且免費的AI服務(wù)，以極低的開發(fā)成本達到了世界頂尖水平，令業(yè)界巨頭和知名投資者紛紛側(cè)目。

DeepSeek的顛覆性在于其前所未有的效率革命。據(jù)悉，其最新發(fā)布的DeepSeek-R1模型系列，在Chatbot Arena大模型排行榜上的基準測試排名已躋身全類別第三，與ChatGPT-4o最新版并駕齊驅(qū)，并在風格控制類模型分類中奪得頭籌。而這一切，都是在不到OpenAI十分之一的成本下實現(xiàn)的。

據(jù)DeepSeek的技術(shù)報告，其V3模型的訓(xùn)練總計僅需278.8萬GPU小時，成本僅為557.6萬美金。相比之下，GPT-4o模型的訓(xùn)練成本高達1億美元，且需要數(shù)量更為龐大的高性能GPU。DeepSeek的這種成本優(yōu)勢，無疑對過往“高投入、高算力”的研發(fā)路徑構(gòu)成了挑戰(zhàn)。

DeepSeek的成功，得益于其自研的MLA和MOE架構(gòu)，以及數(shù)據(jù)蒸餾技術(shù)的運用。這些創(chuàng)新不僅降低了模型訓(xùn)練成本，還提高了訓(xùn)練效率。通過一系列算法和策略，DeepSeek能夠?qū)⒃紡?fù)雜的數(shù)據(jù)進行去噪、降維、提煉，從而得到更為精煉、有用的數(shù)據(jù)。這種“四兩撥千斤”的能力，讓DeepSeek在AI領(lǐng)域脫穎而出。

DeepSeek的崛起，也引發(fā)了業(yè)界對于算力需求的重新審視。在“算力即國力”的思潮下，各國紛紛加大算力基礎(chǔ)設(shè)施的建設(shè)力度。然而，DeepSeek的出現(xiàn)打破了“大力出奇跡”的固有觀念，讓業(yè)界開始思考如何在模型架構(gòu)和工程優(yōu)化上尋求突破。

盡管DeepSeek帶來了算力成本的節(jié)省，但中國的大規(guī)模算力基礎(chǔ)設(shè)施建設(shè)并未因此停滯。相反，這些投入被視為人工智能時代的重要社會財富。目前，中國算力基礎(chǔ)設(shè)施規(guī)模已占全球的26%，名列世界第二。隨著“東數(shù)西算”等數(shù)字基礎(chǔ)設(shè)施工程的積極推進，中國的算力部署將持續(xù)擴大。

DeepSeek的成功，也讓全球科技界重新審視中美AI領(lǐng)導(dǎo)地位的較量。這家中國初創(chuàng)公司的出現(xiàn)，讓原先還處在追趕階段的中國企業(yè)，突然以一種領(lǐng)先或顛覆者的身份出現(xiàn)，令全球科技界大為吃驚。然而，對于算力進行重新判斷或許仍為時過早。長期來看，算力部署仍然有大規(guī)模需求擴張的基礎(chǔ)。

值得注意的是，DeepSeek目前僅支持文字問答、讀圖、讀文檔等功能，還未涉及圖片、音頻和視頻生成領(lǐng)域。未來要想突破文本范疇，其對算力和前期訓(xùn)練成本的投入都將大幅增加。因此，對于其他追隨DeepSeek的大模型公司來說，隨著用戶的增長和產(chǎn)品線的不斷豐富，最終都需要不斷擴張算力。

面對DeepSeek帶來的挑戰(zhàn)，業(yè)界巨頭也開始調(diào)整策略。OpenAI緊急上線了新一代推理模型o3系列的mini版本，并首次免費向用戶開放其基礎(chǔ)功能。微軟、谷歌等科技巨頭也紛紛加大在人工智能領(lǐng)域的投入，期望通過“軍備競賽”維持自身在全球的領(lǐng)導(dǎo)地位。

然而，DeepSeek的成功不僅在于其技術(shù)上的突破，更在于其背后的中國智慧、巧思和韌性。在資源匱乏的歷史條件下，中國實現(xiàn)了工業(yè)現(xiàn)代化，如今在AI領(lǐng)域也展現(xiàn)出了同樣的能力。DeepSeek的成功，是中國在另一個領(lǐng)域中體現(xiàn)出的高性價比策略的勝利。

在中美AI的拉鋸戰(zhàn)中，DeepSeek的崛起無疑為中國企業(yè)增添了一份底氣。然而，我們?nèi)孕璞３掷潇o和謙遜的心態(tài)，繼續(xù)加大在AI領(lǐng)域的研發(fā)投入，推動技術(shù)創(chuàng)新和產(chǎn)業(yè)升級。只有這樣，我們才能在未來的全球科技競爭中立于不敗之地。

更多>同類內(nèi)容