近期,備受矚目的《2025年十大AI技術(shù)趨勢報(bào)告》由智源研究院權(quán)威發(fā)布,該報(bào)告深度剖析了人工智能領(lǐng)域的未來走向,為科技界提供了寶貴的洞察視角。整份報(bào)告共25頁,內(nèi)容詳實(shí)且前瞻性強(qiáng)。
在科研領(lǐng)域,AI4S(人工智能促進(jìn)科學(xué))正成為一股不可忽視的力量。借助海量數(shù)據(jù)訓(xùn)練和強(qiáng)大的架構(gòu),大模型在跨學(xué)科領(lǐng)域如化學(xué)、氣象、生物學(xué)等取得了顯著突破。例如,俄亥俄州立大學(xué)的LlaSMol模型、DeepMind與Isomorphic Labs的AlphaFold 3,以及中國氣象局開發(fā)的氣象大模型等,均展示了AI在科研中的巨大潛力。報(bào)告預(yù)測,到2025年,多模態(tài)大模型將進(jìn)一步助力科研,通過挖掘多維數(shù)據(jù),開拓新的研究方向。
在具身智能領(lǐng)域,中美兩國處于領(lǐng)先地位,國內(nèi)已有近百家企業(yè)參與,融資總額超過百億元。目前,具身智能的技術(shù)路線主要包括端到端模型和分層決策模型,在感知決策端已取得一定成果,但在控制執(zhí)行的泛化能力上仍需突破。報(bào)告認(rèn)為,2025年具身智能行業(yè)或?qū)⒂瓉硐磁?,端到端模型將持續(xù)迭代,工業(yè)應(yīng)用有望顯著增加。
多模態(tài)大模型正朝著原生統(tǒng)一的方向發(fā)展。傳統(tǒng)模型因數(shù)據(jù)融合問題而受限,原生多模態(tài)模型則成為新的趨勢。OpenAI、meta、Google等國際巨頭紛紛推出相關(guān)模型,國內(nèi)也在積極探索。例如,北京智源研究院的Emu3-8B模型,就旨在提升模型對真實(shí)世界的模擬能力。
報(bào)告還指出,Scaling Law的應(yīng)用范圍正在擴(kuò)展至后訓(xùn)練和推理階段。隨著預(yù)訓(xùn)練對模型性能提升的作用逐漸減緩,強(qiáng)化學(xué)習(xí)在新的階段凸顯出重要性。例如,OpenAI的01和03模型就利用了強(qiáng)化學(xué)習(xí)來提升推理效果。國內(nèi)企業(yè)也在積極應(yīng)用強(qiáng)化學(xué)習(xí)技術(shù),以應(yīng)對新的挑戰(zhàn)。
世界模型的加速發(fā)布也引起了廣泛關(guān)注。雖然目前仍處于早期階段,但其潛力巨大,有望推動(dòng)AI在多領(lǐng)域的深度應(yīng)用。2024年,國內(nèi)外在世界模型領(lǐng)域取得了諸多成果,如Google的Genie2、meta的NWM等。報(bào)告預(yù)測,2025年構(gòu)建世界模型的競爭將持續(xù)加劇,技術(shù)路線有望逐漸收斂。
同時(shí),合成數(shù)據(jù)在推動(dòng)大模型發(fā)展中的關(guān)鍵作用也日益凸顯。由于高質(zhì)量數(shù)據(jù)資源的日益緊張,合成數(shù)據(jù)成為降低成本、提升數(shù)據(jù)多樣性的重要手段,其在模型訓(xùn)練中的占比將不斷提高。
在AI應(yīng)用落地方面,推理優(yōu)化至關(guān)重要。隨著大模型應(yīng)用不斷拓展至端側(cè)硬件,推理開銷成為一大挑戰(zhàn)。國內(nèi)外廠商正積極在算法和硬件優(yōu)化兩個(gè)方向上開展研究,以平衡成本與用戶體驗(yàn)。