周一,英偉達(dá)公司(Nvidia Corporation)股價(jià)遭遇重創(chuàng),收盤時(shí)大幅下跌約16.9%,創(chuàng)下了自2020年3月16日以來(lái)的最差單日表現(xiàn)。伴隨股價(jià)暴跌,英偉達(dá)市值蒸發(fā)近6000億美元,打破了這家人工智能(AI)芯片巨頭去年9月創(chuàng)下的美國(guó)上市公司市值單日跌幅最大紀(jì)錄。
此次股市動(dòng)蕩源于中國(guó)AI初創(chuàng)企業(yè)DeepSeek帶來(lái)的沖擊,令美國(guó)AI相關(guān)股票遭遇了一場(chǎng)“血洗”。本周末,DeepSeek的移動(dòng)應(yīng)用在應(yīng)用商店中迅速攀升至榜首,取代了OpenAI的ChatGPT,成為蘋果App Store上美國(guó)最受歡迎的免費(fèi)應(yīng)用。據(jù)移動(dòng)應(yīng)用分析公司Appfigures數(shù)據(jù)顯示,周一,DeepSeek在iOS平臺(tái)的美國(guó)App Store以及另外51個(gè)國(guó)家的應(yīng)用商店中均位列免費(fèi)應(yīng)用第一。
DeepSeek的AI模型上周末在美國(guó)社交媒體平臺(tái)X上迅速走紅,隨后其在應(yīng)用商店的排名也水漲船高。令人震驚的是,DeepSeek僅花費(fèi)了558萬(wàn)美元就訓(xùn)練出了其V3大型語(yǔ)言模型(LLM)。該初創(chuàng)公司聲稱,他們使用了2048個(gè)英偉達(dá)H800芯片,這是英偉達(dá)H100芯片的降級(jí)版本,旨在遵守美國(guó)的出口限制。DeepSeek僅用260萬(wàn)H800小時(shí)就訓(xùn)練出了一個(gè)遠(yuǎn)超meta模型的LLM,而meta使用其Llama 3模型家族的預(yù)算,本可以至少訓(xùn)練15次DeepSeek-V3。
本月早些時(shí)候,DeepSeek發(fā)布了其開源推理模型DeepSeek-R1,聲稱其性能可與OpenAI的o1等領(lǐng)先產(chǎn)品相媲美,但成本卻低得多。多項(xiàng)第三方測(cè)試發(fā)現(xiàn),DeepSeek的實(shí)際表現(xiàn)甚至超過(guò)了OpenAI的最新模型。R1包含6710億個(gè)參數(shù),其“蒸餾”版本的參數(shù)范圍從15億到700億不等。通過(guò)DeepSeek的API,完整版的R1價(jià)格比o1便宜90%-95%。
知名投資者馬克·安德森(Marc Andreessen)周五在社交媒體平臺(tái)X上表示:“DeepSeek的推理模型是我見(jiàn)過(guò)的最令人驚嘆和印象深刻的突破之一,而且作為開源產(chǎn)品,它是給世界的一份深刻禮物?!卑驳律枪韫戎L(fēng)險(xiǎn)投資公司Andreessen Horowitz的負(fù)責(zé)人,他將R1比作“AI的斯普特尼克時(shí)刻”,指的是1957年蘇聯(lián)發(fā)射第一顆人造地球衛(wèi)星,從而引發(fā)了太空競(jìng)賽。
Hugging Face平臺(tái)的開發(fā)者們已經(jīng)創(chuàng)建了500多個(gè)R1的衍生模型,這些模型的總下載量達(dá)到了250萬(wàn)次,是官方R1下載量的五倍,該平臺(tái)CEO克萊姆·德朗(Clem Delangue)在社交媒體平臺(tái)X上的一篇帖子中說(shuō)道。
英偉達(dá)的一位發(fā)言人表示,DeepSeek是“一項(xiàng)出色的AI進(jìn)步”。這位發(fā)言人在周一接受CNBC采訪時(shí)表示:“DeepSeek的工作展示了如何使用這種技術(shù)創(chuàng)建新模型,利用廣泛可用的模型和完全符合出口管制要求的計(jì)算能力。”
路透社援引英偉達(dá)的評(píng)論稱,DeepSeek的推理需要大量英偉達(dá)圖形處理器(GPU)和高性能網(wǎng)絡(luò)的支持。英偉達(dá)還強(qiáng)調(diào),DeepSeek使用的是為中國(guó)市場(chǎng)設(shè)計(jì)的經(jīng)批準(zhǔn)的GPU版本,以反駁有關(guān)潛在出口違規(guī)的指控。
經(jīng)紀(jì)公司杰富瑞評(píng)論稱,DeepSeek在AI訓(xùn)練方面的能效對(duì)上周Stargate和meta做出的重大承諾所引發(fā)的資本支出熱潮造成了一定打擊。鑒于DeepSeek的性能可與GPT-4o相媲美,但計(jì)算能力卻低得多,杰富瑞認(rèn)為,這對(duì)于AI建設(shè)者來(lái)說(shuō)可能產(chǎn)生潛在的負(fù)面影響,因?yàn)锳I企業(yè)面臨越來(lái)越大的壓力來(lái)證明其不斷增加的資本支出計(jì)劃是合理的,這最終可能導(dǎo)致數(shù)據(jù)中心收入和利潤(rùn)增長(zhǎng)的軌跡降低。
然而,花旗集團(tuán)對(duì)這一觀點(diǎn)表示質(zhì)疑,認(rèn)為DeepSeek的成就并非沒(méi)有使用先進(jìn)的GPU進(jìn)行微調(diào)或構(gòu)建最終模型所基于的底層LLM(通過(guò)蒸餾技術(shù))?;ㄆ旒瘓F(tuán)預(yù)計(jì),領(lǐng)先的AI公司不會(huì)放棄使用更先進(jìn)的GPU,因?yàn)樗鼈冊(cè)诖笠?guī)模上提供了更具吸引力的美元/TFLOPs(每秒萬(wàn)億次浮點(diǎn)運(yùn)算)性能。