亚洲精品成人福利网站,无码伊人66久久大杳蕉网站谷歌,亚洲变态另类天堂av手机版,性猛交富婆╳xxx乱大交小说,无码精品国产va在线观看dvd

媒體界 - 推動(dòng)中國(guó)媒體行業(yè)創(chuàng)新,促進(jìn)業(yè)內(nèi)人士交流分享!

大模型邁向AGI:解鎖智能新紀(jì)元,盡頭何在?

   發(fā)布時(shí)間:2025-03-05 15:01 作者:楊凌霄

1956年的夏天,達(dá)特茅斯學(xué)院見證了一場(chǎng)歷史性的學(xué)術(shù)聚會(huì)。數(shù)學(xué)教授約翰·麥卡錫首次提出了“人工智能”這一術(shù)語(yǔ),原本預(yù)期僅用兩個(gè)月時(shí)間徹底探討機(jī)器模擬智能的問題,卻未曾預(yù)料到,這一討論開啟了一場(chǎng)影響深遠(yuǎn)的認(rèn)知革命。

阿里巴巴集團(tuán)CEO吳泳銘在財(cái)報(bào)會(huì)議上的發(fā)言擲地有聲,他預(yù)見到,一旦通用人工智能(AGI)成為現(xiàn)實(shí),其催生的產(chǎn)業(yè)規(guī)?;?qū)⒌琼斎?,甚至可能深刻影響乃至部分取代?dāng)前全球經(jīng)濟(jì)中的半壁江山。

面對(duì)這一科技浪潮,人們?cè)隗@喜與擔(dān)憂中逐漸接納人工智能,同時(shí)也不安地揣測(cè)著AGI的到來。然而,作為本輪AI熱潮的主角,大語(yǔ)言模型或許只是探索AGI路途中的一個(gè)先鋒,距離真正的AGI仍有很長(zhǎng)的路要走,甚至可能并非通往AGI的正確道路。這不禁讓人思考,我們距離實(shí)現(xiàn)真正的AGI究竟還有多遠(yuǎn)?

AGI的概念最初由北卡羅萊納大學(xué)的物理學(xué)家Mark Gubrud在1997年提出,他將其定義為一種在復(fù)雜性和速度上能與人類大腦相媲美或超越的AI系統(tǒng),能夠獲取一般性知識(shí),并基于此進(jìn)行推理和操作,能在各種工業(yè)或軍事活動(dòng)中發(fā)揮人類智力的作用。

長(zhǎng)久以來,AGI被視為人工智能領(lǐng)域的“圣杯”,意味著機(jī)器能夠像人類一樣,在多種任務(wù)中自主學(xué)習(xí)、推理并適應(yīng)復(fù)雜環(huán)境。從GPT-4的對(duì)話能力到Sora的視頻生成,AI技術(shù)近年來取得了長(zhǎng)足的進(jìn)步,但AGI的實(shí)現(xiàn)仍面臨重重挑戰(zhàn)。

AI的核心在于將現(xiàn)實(shí)世界的現(xiàn)象轉(zhuǎn)化為數(shù)學(xué)模型,通過語(yǔ)言讓機(jī)器理解現(xiàn)實(shí)世界與數(shù)據(jù)的關(guān)系。而AGI則更進(jìn)一步,要求AI不再局限于單一任務(wù),而是具備跨領(lǐng)域?qū)W習(xí)和遷移能力,具有更強(qiáng)的通用性。然而,當(dāng)前AI系統(tǒng)雖然在特定任務(wù)上超越了人類,如文本生成和圖像識(shí)別,但本質(zhì)上仍是“高級(jí)模仿”,缺乏對(duì)物理世界的感知和自主決策能力。

大模型在處理任務(wù)時(shí)存在局限性,它們主要處理文本領(lǐng)域的任務(wù),無(wú)法與物理和社會(huì)環(huán)境進(jìn)行互動(dòng)。這意味著像ChatGPT這樣的模型并不能真正“理解”語(yǔ)言的含義,因?yàn)樗鼈儧]有身體來體驗(yàn)物理空間。大模型也不是自主的,需要人類明確定義每個(gè)任務(wù),就像鸚鵡只能模仿被訓(xùn)練過的話語(yǔ)一樣。真正的自主智能應(yīng)該能夠自主完成比現(xiàn)有AI更智能的任務(wù),而當(dāng)前的AI系統(tǒng)尚不具備這種潛力。

盡管ChatGPT已經(jīng)在不同文本數(shù)據(jù)語(yǔ)料庫(kù)上進(jìn)行了大規(guī)模訓(xùn)練,包括隱含人類價(jià)值觀的文本,但它并不具備理解或與人類價(jià)值保持一致的能力,缺乏道德指南針。然而,這并未阻止科技巨頭對(duì)大模型的推崇。OpenAI和谷歌等公司將大模型視為邁向AGI的關(guān)鍵一步。

根據(jù)OpenAI提出的AGI五級(jí)標(biāo)準(zhǔn),當(dāng)前AI技術(shù)正從L2“推理者”階段向L3“智能體”階段躍遷。2025年被認(rèn)為是智能體應(yīng)用爆發(fā)的一年,我們已經(jīng)看到ChatGPT、DeepSeek、Sora等應(yīng)用開始普及,融入人們的生活。

但通往AGI的道路并非一帆風(fēng)順,大模型偶爾出現(xiàn)的“幻覺輸出”暴露出當(dāng)前系統(tǒng)對(duì)因果關(guān)系的理解局限。自動(dòng)駕駛汽車在面對(duì)極端場(chǎng)景時(shí)的決策困境,也折射出現(xiàn)實(shí)世界的復(fù)雜性與倫理悖論。

要實(shí)現(xiàn)AGI,大模型需要經(jīng)歷單模態(tài)到多模態(tài),再到世界模型的演進(jìn)。當(dāng)前階段是多模態(tài)融合階段,如GPT-4V可以理解輸入的文字與圖像,Sora可以根據(jù)輸入的文字、圖像與視頻生成視頻。然而,現(xiàn)階段的多模態(tài)融合還不徹底,“理解”與“生成”兩個(gè)任務(wù)是分開的,導(dǎo)致GPT-4V理解能力強(qiáng)但生成能力弱,而Sora生成能力強(qiáng)但理解能力有時(shí)較差。

多模態(tài)模型能夠處理和理解不同模態(tài)的數(shù)據(jù),如圖像、文本、音頻和視頻,提供比單一模態(tài)更全面、豐富的信息表達(dá)。模擬動(dòng)態(tài)環(huán)境變化并做出預(yù)測(cè)和決策,也需要強(qiáng)大的多模態(tài)生成能力。人與現(xiàn)實(shí)世界的交互涉及多種模態(tài)信息,因此AI必須具備多模態(tài)理解能力。

多模態(tài)模型的研究途徑包括對(duì)齊、融合、自監(jiān)督和噪聲添加。這些技術(shù)結(jié)合使用,使多模態(tài)模型在處理復(fù)雜的現(xiàn)實(shí)世界數(shù)據(jù)方面表現(xiàn)出強(qiáng)大能力。它們能夠理解和生成多模態(tài)數(shù)據(jù),模擬和預(yù)測(cè)環(huán)境變化,幫助智能體做出更精確和有效的決策。

微軟近日開源的多模態(tài)模型Magma就是一個(gè)例子,它不僅具備跨數(shù)字、物理世界的多模態(tài)能力,還能推測(cè)視頻中人物或物體的意圖和未來行為。階躍星辰的兩款Step系列多模態(tài)大模型已與吉利汽車星睿AI大模型完成深度融合,推動(dòng)AI技術(shù)在智能座艙、高階智駕等領(lǐng)域的普及應(yīng)用。

然而,多模態(tài)在發(fā)展過程中仍面臨數(shù)據(jù)獲取和處理、模型設(shè)計(jì)和訓(xùn)練的復(fù)雜性,以及模態(tài)不一致和不平衡等挑戰(zhàn)。多模態(tài)學(xué)習(xí)需要收集和處理來自不同源的數(shù)據(jù),這些數(shù)據(jù)可能具有不同的分辨率、格式和質(zhì)量,需要復(fù)雜的預(yù)處理步驟。獲取高質(zhì)量、標(biāo)注精確的多模態(tài)數(shù)據(jù)成本高昂。

設(shè)計(jì)能夠有效處理和融合多種模態(tài)數(shù)據(jù)的深度學(xué)習(xí)模型比單模態(tài)模型更復(fù)雜。需要考慮如何設(shè)計(jì)合適的融合機(jī)制、平衡不同模態(tài)的信息貢獻(xiàn),以及如何避免模態(tài)間的信息沖突等問題。同時(shí),多模態(tài)模型的訓(xùn)練過程也更為復(fù)雜和計(jì)算密集。

meta人工智能首席科學(xué)家楊立昆認(rèn)為,目前的大模型路線無(wú)法通往AGI。現(xiàn)有大模型雖然表現(xiàn)出色,但只是一種“統(tǒng)計(jì)建?!奔夹g(shù),通過學(xué)習(xí)數(shù)據(jù)中的統(tǒng)計(jì)規(guī)律來完成任務(wù),本質(zhì)上并不具備真正的“理解”和“推理”能力。他認(rèn)為,“世界模型”更接近真正的智能。

世界模型試圖通過對(duì)視頻、音頻等媒體的模擬與補(bǔ)全,讓AI經(jīng)歷自主學(xué)習(xí)的過程,從而形成“常識(shí)”,并最終實(shí)現(xiàn)AGI。世界模型與多模態(tài)大模型的主要區(qū)別在于,世界模型主要通過傳感器直接感知外部環(huán)境信息,輸入數(shù)據(jù)以實(shí)時(shí)感知的外部環(huán)境為主;而多模態(tài)大模型則以圖片、文字、視頻、音頻等信息交互為主。

世界模型的發(fā)展面臨多方面的挑戰(zhàn),包括模擬環(huán)境動(dòng)態(tài)及因果關(guān)系的能力、進(jìn)行反事實(shí)推理的能力,以及物理規(guī)則的模擬能力。為了克服這些挑戰(zhàn),研究人員需要考慮更精確的物理引擎與計(jì)算模型,確保生成的場(chǎng)景遵循真實(shí)世界的物理定律。

評(píng)估世界模型性能的關(guān)鍵標(biāo)準(zhǔn)之一是泛化能力,強(qiáng)調(diào)數(shù)據(jù)外推而非僅數(shù)據(jù)內(nèi)插。例如,學(xué)習(xí)得到的世界模型能否想象罕見的駕駛事件,要求模型不僅要記憶訓(xùn)練數(shù)據(jù),還要發(fā)展對(duì)駕駛原理的深刻理解。

通過在模型訓(xùn)練過程中加入更多真實(shí)場(chǎng)景的實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù),可以讓AI更好地理解三維世界的空間關(guān)系、運(yùn)動(dòng)行為和物理規(guī)律,從而實(shí)現(xiàn)對(duì)物理世界的洞察和理解。AGI的到來或許不會(huì)像奇點(diǎn)理論預(yù)言的那樣突然,而是在數(shù)據(jù)洪流的沖刷下逐漸顯現(xiàn)。

AI的未來并非一個(gè)固定終點(diǎn),而是人類與技術(shù)共同書寫的敘事。它可能是工具、伙伴、威脅,或是超越想象的形態(tài)。關(guān)鍵問題或許不在于“AI的盡頭是什么”,而在于“人類希望以何種價(jià)值觀引導(dǎo)AI的發(fā)展”。答案取決于我們今天的決策與責(zé)任。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新