近期,人工智能領(lǐng)域掀起了一場(chǎng)關(guān)于Llama 4模型的熱烈討論,多位業(yè)界領(lǐng)袖和學(xué)者紛紛發(fā)聲,對(duì)Llama 4的表現(xiàn)提出了質(zhì)疑,并探討了其對(duì)AI未來(lái)發(fā)展的影響。
一位知名AI公司CEO深入剖析了Llama 4存在的五大疑點(diǎn),引發(fā)了廣泛共鳴。他指出,Llama 4所宣稱的突破并未如愿帶來(lái)顯著的智能提升,反而暴露出一系列問(wèn)題。同時(shí),有圈內(nèi)人士悲觀地認(rèn)為,Llama 4的表現(xiàn)或許標(biāo)志著單純依靠模型規(guī)模擴(kuò)大(Scaling)來(lái)提升AI能力的時(shí)代已經(jīng)結(jié)束,大型語(yǔ)言模型(LLM)在推理能力上的欠缺依然難以彌補(bǔ)。
Anthropic公司的CEO Dario也制作了一段長(zhǎng)視頻,詳細(xì)列舉了Llama 4的六大疑點(diǎn)。他逐一剖析了Llama 4在性能、發(fā)布時(shí)機(jī)、測(cè)試數(shù)據(jù)等方面的爭(zhēng)議,指出其可能存在的夸大宣傳和測(cè)試作弊等問(wèn)題。Dario的剖析進(jìn)一步加劇了業(yè)界對(duì)Llama 4真實(shí)能力的懷疑。
紐約大學(xué)教授馬庫(kù)斯則在博客中總結(jié)了當(dāng)前AI領(lǐng)域的現(xiàn)狀,直言不諱地表示,Scaling時(shí)代已經(jīng)結(jié)束,模型仍然無(wú)法可靠推理,金融泡沫正在破裂,GPT-5的推出遙遙無(wú)期,對(duì)不可靠語(yǔ)言模型的過(guò)度依賴已經(jīng)讓世界陷入了困境。他此前做出的多項(xiàng)預(yù)測(cè),如今看來(lái)一一應(yīng)驗(yàn)。
馬庫(kù)斯強(qiáng)調(diào),大語(yǔ)言模型并非解決問(wèn)題的萬(wàn)能鑰匙,我們需要探索更可靠的方法。他指出,像OpenAI和Anthropic這樣的公司,雖然致力于推動(dòng)AI技術(shù)的發(fā)展,但面對(duì)高昂的研發(fā)成本,它們的資金儲(chǔ)備顯然難以為繼。如果投資者對(duì)經(jīng)濟(jì)衰退的預(yù)期增強(qiáng),AI領(lǐng)域的投資將進(jìn)一步縮減,從而導(dǎo)致AI進(jìn)展放緩。
Dario在之前的采訪中曾提到,戰(zhàn)爭(zhēng)可能是阻止AI進(jìn)步的一個(gè)因素。然而,如今看來(lái),系統(tǒng)的另一種混沌狀態(tài)似乎已經(jīng)提前到來(lái)。他預(yù)測(cè),如果技術(shù)無(wú)法繼續(xù)向前發(fā)展,資本化不足將成為AI進(jìn)步的重大阻礙。Llama 4的爭(zhēng)議無(wú)疑加劇了這一趨勢(shì)。
關(guān)于Llama 4的具體疑點(diǎn),首先在于其所謂的業(yè)界領(lǐng)先的一千萬(wàn)個(gè)token的上下文窗口是否名副其實(shí)。有對(duì)比數(shù)據(jù)顯示,早在Llama 4發(fā)布之前,Gemini 1.5 Pro就已經(jīng)達(dá)到了這一標(biāo)準(zhǔn),并且在長(zhǎng)上下文深度理解基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,而Llama 4的中等模型和小模型則表現(xiàn)不佳。
其次,Llama 4選擇在周六發(fā)布也引發(fā)了諸多猜測(cè)。這一非典型的發(fā)布時(shí)間,以及模型訓(xùn)練數(shù)據(jù)截止時(shí)間的滯后,都讓人懷疑meta是否在刻意避開公眾視線,試圖掩蓋模型的不足。關(guān)于Llama 4在LM Arena上是否存在作弊行為的質(zhì)疑也甚囂塵上,盡管LM Arena已經(jīng)公開了測(cè)試數(shù)據(jù)并表示將重新評(píng)估排行榜,但這一事件依然對(duì)Llama 4的聲譽(yù)造成了不可磨滅的影響。
Llama 4在編碼基準(zhǔn)測(cè)試中的糟糕表現(xiàn),也與其宣傳的“取代中級(jí)程序員”的言論形成了鮮明對(duì)比。在ADA的Polyglot編碼基準(zhǔn)測(cè)試中,Llama 4 Maverick的得分慘不忍睹,遠(yuǎn)低于Gemini 2.5 Pro等競(jìng)爭(zhēng)對(duì)手。這一系列爭(zhēng)議和質(zhì)疑,無(wú)疑給Llama 4的前景蒙上了一層陰影。