隨著2024年步入尾聲,國內(nèi)AI大模型領(lǐng)域迎來了一波新的發(fā)展高潮。多家大模型廠商似乎都在為年終業(yè)績沖刺,好消息接踵而至。
先是智譜,作為業(yè)界知名的“大模型六小虎”之一,成功完成了高達(dá)30億元的新一輪融資。緊接著,字節(jié)跳動(dòng)推出了豆包視覺理解模型,而快手也緊隨其后,正式上線了可靈1.6版本。這一系列動(dòng)作無疑為整個(gè)行業(yè)注入了新的活力。
如果說2023年標(biāo)志著大模型技術(shù)的元年,那么2024年則可以被視為AI技術(shù)的應(yīng)用之年。這一年里,深度推理技術(shù)逐漸成為主流,AI Agent成為新的風(fēng)口,多模態(tài)模型也競相涌現(xiàn)。AI產(chǎn)品的迭代速度之快,讓人不禁感嘆技術(shù)發(fā)展的日新月異。然而,從AI技術(shù)的爆發(fā)至今,其實(shí)還不到兩年的時(shí)間。
在這短短的時(shí)間里,AI技術(shù)仿佛經(jīng)歷了十年的變革。但盡管如此,這一被視為互聯(lián)網(wǎng)級(jí)變革的產(chǎn)品,卻至今仍未迎來真正的爆發(fā)時(shí)刻。
過去,算力被視為大模型發(fā)展的關(guān)鍵要素。在百模大戰(zhàn)如火如荼的那一年,許多廠商都試圖通過增加參數(shù)來迅速占領(lǐng)市場份額。然而,從今年開始,這種策略似乎已經(jīng)不再奏效。隨著行業(yè)的快速迭代,僅靠算力和參數(shù)規(guī)模的提升已經(jīng)難以真正超越同行。再加上大模型的訓(xùn)練和運(yùn)營需要大量的算力和資金投入,這對(duì)現(xiàn)階段還難以找到成熟商業(yè)模式的廠商來說,無疑是一個(gè)巨大的挑戰(zhàn)。
以字節(jié)跳動(dòng)為例,據(jù)報(bào)道,僅在2024年,該公司在AI領(lǐng)域的投入就達(dá)到了驚人的800億元,幾乎相當(dāng)于BAT三家公司資本開支的總和。而到了2025年,這一數(shù)字還將進(jìn)一步攀升至1600億元,其中約900億元將用于AI算力的采購。即使如此,算力仍然是一個(gè)巨大的瓶頸。微軟為了支持ChatGPT和新版必應(yīng)的算力需求,甚至不惜耗費(fèi)幾億美元和上萬張英偉達(dá)A100芯片來打造超算平臺(tái)。
然而,從長遠(yuǎn)來看,算力并不能構(gòu)成真正的護(hù)城河。它更多地體現(xiàn)為硬件層面的核心競爭力。真正決定模型表現(xiàn)的是算力和訓(xùn)練語料的質(zhì)量,而這兩者都取決于經(jīng)濟(jì)實(shí)力。因此,即使谷歌和OpenAI這樣的巨頭也難以保持技術(shù)優(yōu)勢。
目前國內(nèi)大模型的現(xiàn)狀是,各公司的模型能力參差不齊,但核心功能普遍同質(zhì)化嚴(yán)重。一個(gè)新功能推出后,很快就會(huì)被其他廠商趕上。例如,Kimi最初靠長文本成功進(jìn)入了國內(nèi)AI大模型的第一梯隊(duì),但現(xiàn)在長文本已經(jīng)成為大多數(shù)AI搜索產(chǎn)品的基本能力。
隨著競爭的加劇,AI領(lǐng)域的關(guān)鍵詞開始從“模型層”轉(zhuǎn)向“應(yīng)用層”。下半年以來,越來越多的廠商開始關(guān)注AI技術(shù)的實(shí)際應(yīng)用場景。然而,同質(zhì)化的問題在應(yīng)用層也同樣存在。例如,豆包視覺理解模型發(fā)布后,很快就遭遇了Kimi視覺思考版的競爭。
在這種情況下,如何找到破圈點(diǎn)成為了AI廠商們共同面臨的難題。一些業(yè)內(nèi)人士指出,未來能否出現(xiàn)殺手級(jí)別的應(yīng)用,將是決定各家勝負(fù)的關(guān)鍵。然而,至少到目前為止,我們還看不到這樣的火花。盡管AIGC技術(shù)在某些領(lǐng)域取得了進(jìn)展,但整體上仍處于發(fā)展階段,生成內(nèi)容的質(zhì)量、穩(wěn)定性和可控性等方面仍存在不足。
在硬件端,AI手機(jī)也成為了新的競爭焦點(diǎn)。幾乎所有頭部手機(jī)廠商都在對(duì)語音交互進(jìn)行升級(jí),試圖將之前的語音助手打造成更智能的AI Agent。然而,這種升級(jí)更多地只是停留在噱頭上,真正的AI體驗(yàn)并沒有太大的變化。
商業(yè)化方面,AI應(yīng)用之所以受到如此重視,一個(gè)重要原因是市場亟需看到AI技術(shù)能轉(zhuǎn)化為可落地的商業(yè)模式。然而,這并不容易。付費(fèi)訂閱和廣告是目前AI搜索類產(chǎn)品能觸及的主要盈利模式,但前者在國內(nèi)市場一直難以走通,后者則可能損害用戶體驗(yàn)。
以豆包為例,盡管其用戶規(guī)模在過去幾個(gè)月有所增長,但在使用時(shí)長、打開頻次及商業(yè)化潛力上仍不夠理想。字節(jié)管理層判斷AI對(duì)話類產(chǎn)品可能只是AI產(chǎn)品的“中間態(tài)”,長期更理想的產(chǎn)品形式可能需要更視覺化的用戶體驗(yàn)和更低的用戶使用門檻。因此,字節(jié)已經(jīng)提升了即夢的產(chǎn)品優(yōu)先級(jí),嘗試用新的路徑打造AI時(shí)代的“抖音”。
盡管如此,AI對(duì)話類產(chǎn)品作為生成式大模型在C端落地后最拿得出手的產(chǎn)品,其更大的作用仍然是樣本收集場景,而不是賺錢的場景。只要有活躍的用戶和可持續(xù)的使用價(jià)值,AI對(duì)話類產(chǎn)品的重要性就仍然存在。
回顧上一代移動(dòng)互聯(lián)網(wǎng)級(jí)別的創(chuàng)新,從APP Store的推出到智能手機(jī)規(guī)?;瘧?yīng)用的爆發(fā),走了五年的時(shí)間。而如今AI技術(shù)只用了不到兩年的時(shí)間,就已經(jīng)讓我們看到了質(zhì)的飛躍?;蛟S在不久的將來,我們就能見證下一個(gè)iPhone時(shí)代拐點(diǎn)的到來。