在人工智能領域,2023年無疑是OpenAI大放異彩的一年,其推出的ChatGPT迅速成為行業(yè)焦點。彼時,國內科技巨頭與OpenAI的差距眾說紛紜,從幾個月到數(shù)年不等。然而,一個不爭的事實是,中國企業(yè)在大型語言模型賽道上始終處于追趕狀態(tài)。
進入2025年,格局悄然生變。一家名為DeepSeek的新星以質價比模式異軍突起,迅速搶占AI行業(yè)的C位。1月11日前后,DeepSeek App在全球范圍內上線,據數(shù)據顯示,發(fā)布18天內累計下載量高達1600萬次,超越了同期ChatGPT的900萬次下載。截至2月5日,DeepSeek的全球下載量已逼近4000萬大關,與ChatGPT的4100萬下載量相差無幾。在日活方面,DeepSeek也取得了顯著成績,1月31日日活用戶達到2215萬,相當于ChatGPT的41.6%。
DeepSeek的迅猛勢頭不僅體現(xiàn)在用戶增長上,更在于其給行業(yè)帶來的震撼。盡管在總用戶量和日活上與ChatGPT仍有差距,但其增速已足夠讓包括ChatGPT在內的所有大型模型廠商感到壓力。業(yè)界紛紛好奇,DeepSeek究竟是如何做到的?
與此同時,百度集團執(zhí)行副總裁沈抖在內部會議上提及DeepSeek對百度的影響。他認為,雖然短期內DeepSeek會給百度帶來挑戰(zhàn),但長遠來看利大于弊。沈抖特別指出,面對DeepSeek的沖擊,字節(jié)跳動的AI產品可能首當其沖,因其訓練成本和投放成本均較高。
關于DeepSeek的真相與謠言,一時間成為熱議話題。DeepSeek成立時間雖短,但其背后的運營主體——杭州深度求索人工智能基礎技術研究有限公司,自2023年7月成立以來,已展現(xiàn)出非凡實力。深度求索通過兩個模型——V3和R1,證明了其技術實力。V3在多項評測中超越主流開源模型,且具有成本優(yōu)勢;而R1則憑借純深度學習方法讓AI自發(fā)涌現(xiàn)推理能力,性能比肩OpenAI的o1模型。
DeepSeek的成本優(yōu)勢尤為引人注目。據透露,R1模型的訓練成本僅為600萬美元,遠低于OpenAI、谷歌等巨頭的數(shù)億乃至數(shù)十億美元投入。這一成本優(yōu)勢引發(fā)了廣泛爭議,主要集中在DeepSeek是否真的能以如此低的成本實現(xiàn)高性能。然而,深度求索通過公開數(shù)據和解釋,有力回應了這些質疑。
DeepSeek的創(chuàng)新之處不僅在于成本,更在于其技術策略。在大型模型行業(yè)普遍追求算力和數(shù)據的背景下,DeepSeek采取了開源策略,打破了巨頭壟斷的格局。開源使得DeepSeek的技術更易于被行業(yè)采用和修改,從而推動了AI技術的普及和發(fā)展。Stability AI前研究主管Tanishq Mathew Abraham強調了DeepSeek的三個創(chuàng)新點:多頭注意力機制、可驗證獎勵的GRPO強化學習算法變體以及DualPipe訓練方法。
DeepSeek的崛起對行業(yè)產生了深遠影響。一方面,它沖擊了以OpenAI為首的閉源大模型廠商,迫使他們重新審視自己的商業(yè)模式和競爭力;另一方面,它也推動了推理芯片需求的增長,加速了AI應用的普及。隨著DeepSeek加快了人工智能從“訓練階段”到“推理階段”的周期,對推理芯片和計算的需求將越來越大。
然而,DeepSeek也面臨著商業(yè)化挑戰(zhàn)。由于其采取了開源策略,競爭對手可以利用其技術開發(fā)相似產品,這對DeepSeek的商業(yè)化構成了威脅。目前,已有研究團隊以極低成本成功訓練出與R1性能相當?shù)哪P停@進一步加劇了市場競爭。
盡管如此,DeepSeek的成績仍然值得肯定。它不僅在技術上取得了突破,更在商業(yè)模式上探索了新的方向。未來,DeepSeek能否在商業(yè)化上取得成功,將決定其能否在AI領域走得更遠。
在DeepSeek的推動下,AI行業(yè)正迎來新的變革。未來,隨著技術的不斷進步和應用的不斷拓展,AI將深刻改變我們的生活和工作方式。而DeepSeek作為這場變革的引領者之一,其發(fā)展前景值得期待。