近期,一則關(guān)于“H100 GPU租賃價(jià)格驟降至2美元/小時(shí)”的報(bào)道在國(guó)內(nèi)引發(fā)了廣泛關(guān)注。據(jù)報(bào)道,英偉達(dá)H100 GPU自2023年3月上市后,因需求激增一度供不應(yīng)求,租賃價(jià)格從4.7美元/小時(shí)飆升至8美元/小時(shí)以上。然而,今年以來,H100市場(chǎng)出現(xiàn)“供過于求”現(xiàn)象,租賃價(jià)格大幅下跌至2美元左右。
價(jià)格下跌的原因多樣:部分公司完成模型訓(xùn)練后轉(zhuǎn)售閑置算力;許多企業(yè)轉(zhuǎn)而微調(diào)開放模型,降低了算力需求;新創(chuàng)公司專注于構(gòu)建大規(guī)?;A(chǔ)模型的數(shù)量減少;以及H100替代品的出現(xiàn),如AMD和英特爾的GPU。
追溯報(bào)道源頭發(fā)現(xiàn),海外主流媒體及主要科技媒體尚未進(jìn)行相關(guān)報(bào)道。原報(bào)道《$2 H100s: How the GPU Bubble Burst》出自Latent Space網(wǎng)站,作者為Eugene Cheah。Latent Space是一個(gè)聚焦于AI的內(nèi)容訊息、博客、社區(qū)平臺(tái),由swyx及Alessio Fanelli主持,后者為早期風(fēng)投公司Decibel VC的合伙人和CTO。
Eugene Cheah是初創(chuàng)公司Featherless.Ai的CEO。據(jù)其介紹,F(xiàn)eatherless.Ai目前托管著全球最大的開源AI模型,提供每月10美元起的無限制請(qǐng)求服務(wù)。
報(bào)道中配有一幅法國(guó)藝術(shù)家讓-萊昂?熱羅姆1882年創(chuàng)作的油畫《郁金香狂熱》,描繪了17世紀(jì)荷蘭的“郁金香狂熱”投機(jī)泡沫。這一歷史事件是否會(huì)在AI領(lǐng)域重演,牽動(dòng)著每一位AI投資者的心,也是此次報(bào)道引發(fā)關(guān)注的原因之一。
從算力租賃商Vast.ai的報(bào)價(jià)來看,1x H100的一小時(shí)租賃價(jià)格確實(shí)已降至2~3美元區(qū)間。
然而,H100租賃價(jià)格下跌是否真的意味著“GPU泡沫破滅”呢?一方面,Eugene Cheah指出,“H100價(jià)格下跌”更適用于“分化”這一描述,主要集中在小規(guī)模集群的租賃價(jià)格,而大規(guī)模算力集群的價(jià)格可能維持在較高水平。
另一方面,電子產(chǎn)品具有更新迭代周期,GPU芯片也不例外。盡管英偉達(dá)下一代GPU Blackwell系列曾傳出設(shè)計(jì)缺陷,但摩根士丹利報(bào)告稱,Blackwell的生產(chǎn)正在“按計(jì)劃進(jìn)行”,且未來12個(gè)月左右的供應(yīng)已經(jīng)售罄。這意味著現(xiàn)在下訂單的客戶要到2025年底才能收到貨,將繼續(xù)推動(dòng)對(duì)現(xiàn)有Hopper架構(gòu)產(chǎn)品的短期需求。
H100租賃價(jià)格的波動(dòng)并非驟然暴跌,而是已有時(shí)日。從A100到H100,再到未來的Blackwell,新品出世勢(shì)必帶來前代產(chǎn)品的沒落。英偉達(dá)CEO黃仁勛也表示,英偉達(dá)的持續(xù)看漲與互聯(lián)網(wǎng)泡沫頂峰時(shí)期圍繞思科的狂熱完全不同。他認(rèn)為,未來將是“高度機(jī)器學(xué)習(xí)”的時(shí)代。
“摩爾定律已經(jīng)基本宣告終結(jié)”,黃仁勛表示,為了提供必要的算力以跟上未來計(jì)算密集型軟件的步伐,未來4~5年內(nèi),現(xiàn)有數(shù)據(jù)中心將需要價(jià)值約1萬億美元的GPU來實(shí)現(xiàn)升級(jí)。
必須承認(rèn)的是,“AI泡沫”論的警鐘頻敲,“AI投資回報(bào)難達(dá)預(yù)期”的質(zhì)疑聲音此起彼伏。一邊是OpenAI抱怨算力上線不及時(shí)不夠用、英偉達(dá)新品售罄,另一邊是算力租賃價(jià)格不斷下降、還有公司“甩賣”GPU。然而,局部的、短期的算力過?;蚨倘?,似乎已難以代表AI的全盤局面。