12月7日,在北京市大興區(qū)舉辦的2024T-EDGE創(chuàng)新大會暨鈦媒體財經(jīng)年會上,暗物智能DMAI前美國CEO、藍色光標(biāo)前美國總裁符海京和哈佛大學(xué)博士、加州大學(xué)伯克利分校人工智能實驗室執(zhí)行董事、Dark Matter AI聯(lián)合創(chuàng)始人、微軟/亞馬遜顧問 Mark Nitzberg 展開了一場深入對談,探討生成式AI的潛力、困境與未來。
在Mark Nitzberg 看來,盡管生成式AI在許多任務(wù)中展現(xiàn)了顯著的效率提升——例如回答復(fù)雜問題、生成高質(zhì)量內(nèi)容等——但這項技術(shù)仍處于實驗階段,可靠性問題成了制約其進一步發(fā)展的主要障礙?!爱?dāng)前的模型在性能上的確進步巨大,但我們無法忽視它們在關(guān)鍵場景中的不一致性。例如,一個細微的輸入變化可能導(dǎo)致模型輸出答案出現(xiàn)巨大偏差,而這種不確定性是無法在醫(yī)療、交通等高風(fēng)險領(lǐng)域被接受的?!?
與此同時,Mark Nitzberg 特別提到生成式AI在許多新興領(lǐng)域中展現(xiàn)了指數(shù)級的效率提升。例如,他分享了瑞典對多個行業(yè)進行的分析研究,其中“建筑修復(fù)”這一領(lǐng)域因生成式AI的應(yīng)用效率比傳統(tǒng)方法提升了約100倍。
不過他也保持了理性態(tài)度。Mark Nitzberg 提醒道:“雖然這些效率提升令人興奮,但它們的可持續(xù)性依然取決于我們能否攻克技術(shù)可靠性的問題。”
Mark Nitzberg 特別強調(diào),如果我們將生成式AI引入我們所做的每一個領(lǐng)域,就需要確保我們對沒有它時的操作方式有清晰的理解。只有這樣,當(dāng)我們引入AI并使其更高效、更快速地運行時,我們才不會將之前手動操作中的“問題部分”也自動化。
Mark Nitzberg認為生成式AI向智能體的轉(zhuǎn)變潛力巨大,但同時也伴隨著復(fù)雜的技術(shù)挑戰(zhàn)和安全隱患,可靠性和控制機制是未來發(fā)展的重要研究方向。對于未來的研究重點,Mark Nitzberg表示將集中在兩個方面:一是多模態(tài)數(shù)據(jù)的整合,二是因果推理的增強。
以下為符海京和Mark Nitzberg對話實錄,略經(jīng)鈦媒體App編輯:
中美都尚處于生成式AI的“實驗時代”
符海京:歡迎來到2024年T Edge大會。由于特殊情況,今天的特邀嘉賓無法親自到場與大家面對面交流,所以我們特別安排了連線對話。讓我們聊聊你的實驗室,以及AI領(lǐng)域有什么新的動態(tài)?
Mark Nitzberg:美國加州大學(xué)伯克利分校是全球頂尖的高等教育機構(gòu)之一,同時也是一個非常優(yōu)秀的AI實驗室所在地。這個實驗室很有趣,因為它是一個公共的AI實驗室。我們有70位教授,還有超過400名博士生,其中許多是中國籍學(xué)生,以及成千上萬的本科生。
AI已經(jīng)以某種方式融入了人類生活的方方面面。但我們實際上仍處于生成式AI的實驗時代,這一切才剛剛開始。
AI的基礎(chǔ)是數(shù)字計算基礎(chǔ)設(shè)施,而這種基礎(chǔ)設(shè)施幾乎已經(jīng)介入了人類的每一項活動。這背后是全球互聯(lián)網(wǎng)。幾年前的數(shù)據(jù)表明,人類每年創(chuàng)造的數(shù)字數(shù)據(jù)量達到120澤字節(jié)(zettabytes)。這是一個非常龐大的數(shù)字,相當(dāng)于1200億TB,而你手中的設(shè)備可能只有1TB的存儲空間。
互聯(lián)網(wǎng)可以說是人類最大的技術(shù)創(chuàng)造,連接了我們所有人以及無數(shù)設(shè)備。這些數(shù)據(jù)的生成為AI的突破奠定了基礎(chǔ)。這些數(shù)據(jù)的生成,以及提供服務(wù)的公司高度集中化,構(gòu)建了數(shù)據(jù)、網(wǎng)絡(luò)和處理能力的基礎(chǔ)設(shè)施。這些基礎(chǔ)設(shè)施使得神經(jīng)網(wǎng)絡(luò)的發(fā)明成為可能,因為訓(xùn)練神經(jīng)網(wǎng)絡(luò)需要大量的數(shù)據(jù)。
隨后,大的技術(shù)突破是嵌入技術(shù)(embeddings)和transformers架構(gòu),它們催生了大型語言模型(LLMs),這一切始于2017年。因此,生成式AI的影響力源于我們生活在一個擁有超強傳感器、高度連接的設(shè)備和高度集中的數(shù)字服務(wù)的世界。這一切構(gòu)成了生成式AI的基礎(chǔ)。
符海京:我想大家可能會好奇,生成式AI如何在不同的地理區(qū)域和不同行業(yè)中產(chǎn)生影響?
Mark Nitzberg:生成式AI的出現(xiàn)有一些值得理解的關(guān)鍵點。如果你要構(gòu)建一個控制像水電大壩這樣強大系統(tǒng)的計算系統(tǒng),就需要應(yīng)用典型的工程方法來限制其行為。比如,你需要設(shè)定運行速度的上限,或者確保它不會超過某些閾值。
這是一個令人興奮的前景——我們可以使用看似“智能”的語言模型來控制水電大壩。然而,這些變換器模型的本質(zhì)是一個巨大的電路板,就像一個混音面板,但這個混音面板有數(shù)萬億個旋鈕。每個旋鈕在訓(xùn)練過程中都會被調(diào)整。你輸入一些數(shù)據(jù),如果輸出結(jié)果不符合預(yù)期,就調(diào)整旋鈕。這個過程重復(fù)上百萬億次,最終你會得到一個所有旋鈕都調(diào)整好的電路板,這就是我們現(xiàn)在使用的語言模型,比如GPT-4等。
這些商業(yè)模型有幾個共同點。首先,它們非常強大,能夠完成許多令人驚訝的任務(wù),比如回答各種復(fù)雜問題、生成圖像等,它們在廣泛的應(yīng)用領(lǐng)域中表現(xiàn)出色。
然而,它們也有一個共同的問題,那就是不可靠。也就是說,你不能指望一個語言模型去回答醫(yī)療問題。雖然我們可以在它們外面構(gòu)建一個所謂的“安全層”,但實際上很難對這些模型的行為提供任何形式的保證。這也在一定程度上限制了它們的應(yīng)用范圍。
我們目前仍然處于生成式AI的實驗時代。無論是在美國、中國,還是世界其他地方。初步的結(jié)果表明,許多任務(wù)可以通過生成式AI顯著加速,并帶來更高質(zhì)量的成果。結(jié)果的提升取決于用戶的經(jīng)驗水平。例如,管理咨詢行業(yè)的效率可以提高15%到50%,而在編程領(lǐng)域,有些開發(fā)者報告稱他們的效率翻倍。
更有趣的是,我們看到一些新任務(wù)的效率提升可能是“指數(shù)級”的,比如在某些特定領(lǐng)域,效率可能提升100倍。例如,我最近了解到,瑞典對其經(jīng)濟各個行業(yè)進行了全面研究,發(fā)現(xiàn)生成式AI在“建筑修復(fù)”這一領(lǐng)域的效率提升最為顯著。這是一個你可能不會想到會有巨大影響的領(lǐng)域,但確實如此。
不過,這些預(yù)測需要謹慎對待,因為我們還不知道是否能夠解決生成式AI的可靠性問題。
符海京:這背后的關(guān)鍵是什么?作為一名科學(xué)家、實踐者和教育者,你認為這個轉(zhuǎn)型成功的最重要因素是什么?
Mark Nitzberg:我認為,任何重大自動化技術(shù)的共同主題是:它必須適合其用途。如果我們將生成式AI引入我們所做的每一個領(lǐng)域,就需要確保我們對沒有它時的操作方式有清晰的理解。這樣,當(dāng)我們引入AI并使其更高效、更快速地運行時,我們不會將之前手動操作中的“問題部分”也自動化。
創(chuàng)業(yè)者應(yīng)在細分行業(yè)中探索
符海京:數(shù)據(jù)是生成式AI的”汽油”,巨型企業(yè)比如美國的significant seven和中國的百度具有競爭優(yōu)勢,創(chuàng)業(yè)者應(yīng)該如何在這場轉(zhuǎn)型競賽中取勝?
Mark Nitzberg:數(shù)字化工具正在為下一代提供應(yīng)用AI的基礎(chǔ),而這個領(lǐng)域的應(yīng)用仍然是“廣闊未定”的。創(chuàng)業(yè)者可以在各個行業(yè)中探索如何應(yīng)用這些工具。
例如,我們正在與加州大學(xué)舊金山分校(UCSF)醫(yī)療中心合作,開發(fā)一種變換器模型的變體。與傳統(tǒng)的語言模型訓(xùn)練文本不同,我們的模型是基于患者治療的臨床步驟進行訓(xùn)練的。訓(xùn)練數(shù)據(jù)包括數(shù)百萬個序列,例如患者首次出現(xiàn)癥狀、進行的測試、可能開出的藥物、后續(xù)檢查等。這種訓(xùn)練方法產(chǎn)生了一種完全不同的變換器系統(tǒng),它更加“可解釋”。比如,當(dāng)模型建議進行胸部掃描時,你可以理解它這樣建議的原因可能是因為發(fā)現(xiàn)了肺部問題。這是一種新的方向,其核心仍然是“適合用途”。
智能體更加考驗可靠性和安全性
符海京:我想談?wù)凙I的“推理”reasoning能力。我會分享微軟今天在Yahoo Finance上的最新聲明。他們提到自動化代理(automation agents),并使用了“AI可以更好地推理”的說法,同時也提到它們能夠以更復(fù)雜的方式感知環(huán)境。之前我們在暗物智能 DMAI致力于認知AI的層次架構(gòu) (cognitive AI framework),你對微軟今天的聲明怎么看呢?
Mark Nitzberg:這是一個非常有趣的方向,也是生成式AI未來發(fā)展的關(guān)鍵領(lǐng)域之一。微軟提到的實際上是AI從工具型系統(tǒng)向更高級智能體(agent)轉(zhuǎn)變的標(biāo)志。這意味著AI不僅能夠處理輸入和輸出,還可以在復(fù)雜環(huán)境中感知、推理并采取行動。
但這里需要注意的是,所謂的“推理”并不是傳統(tǒng)意義上的邏輯推理,而是基于大量數(shù)據(jù)的統(tǒng)計相關(guān)性和模式識別。換句話說,當(dāng)前的AI在某種程度上模擬了人類的推理過程,但它并不真正“理解”所做的事情。這種能力的提升更多依賴于模型的復(fù)雜性和訓(xùn)練數(shù)據(jù)的質(zhì)量。
環(huán)境感知的復(fù)雜性也提出了新的挑戰(zhàn)。AI需要處理多模態(tài)數(shù)據(jù)(例如文本、圖像、聲音等),并在動態(tài)環(huán)境中實時做出響應(yīng)。微軟的聲明表明,他們的目標(biāo)是將AI從靜態(tài)的生成工具轉(zhuǎn)變?yōu)閯討B(tài)的智能體,能夠感知環(huán)境、推理因果關(guān)系并做出自主決策。
符海京:你提到的可靠性和控制機制確實是一個關(guān)鍵問題。那么,你認為在這一領(lǐng)域,接下來的研究重點應(yīng)該是什么?
Mark Nitzberg:我認為接下來的研究重點應(yīng)該集中在兩個方面:一是多模態(tài)數(shù)據(jù)的整合,二是因果推理的增強。
在因果推理方面,我們需要讓AI不僅僅停留在相關(guān)性分析上,而是能夠真正理解因果關(guān)系。這對于復(fù)雜環(huán)境中的決策至關(guān)重要。例如,在醫(yī)療診斷中,AI需要知道某種治療方法為什么有效,而不僅僅是基于歷史數(shù)據(jù)的模式預(yù)測。這種因果推理能力的提升將使AI在關(guān)鍵領(lǐng)域(如醫(yī)療、自動駕駛和金融)中更具實用性和可靠性。
總的來說,AI的未來在于從“工具”向“智能體”轉(zhuǎn)變,但這一轉(zhuǎn)變需要我們在技術(shù)、倫理和政策層面上進行全面的探索和協(xié)調(diào)。
符海京:這意味著AI可以執(zhí)行更復(fù)雜的一系列任務(wù)。你是否樂觀地認為這真的在發(fā)生,還是說它依然是一個不可預(yù)測的“黑箱”?在推理方面,Satya Nadella(微軟 CEO)提到,直到最近,語言模型的行為中確實存在一個很大的“缺口”。它會給出一些荒謬的建議,無法正確地進行推理。比如,如果你告訴它“海倫是大衛(wèi)的母親”,它無法推理出“大衛(wèi)是海倫的兒子”。在這方面,它的推理能力并不完善。不過,經(jīng)過顯著的訓(xùn)練、架構(gòu)上的調(diào)整和優(yōu)化,它的表現(xiàn)確實有了很大的提升。
Mark Nitzberg:然而,我們?nèi)匀徊恢肋@種提升的極限在哪里。同樣,也沒有任何可靠的保證。所以我認為,微軟所談?wù)摰氖亲屵@些系統(tǒng)在某些特定任務(wù)中達到一個實用的可靠性水平——而這些任務(wù)以前是無法實現(xiàn)的。但我不確定是否可以對這些系統(tǒng)在高關(guān)鍵性任務(wù)中使用下注。因為即便是一個小小的請求變化,也可能導(dǎo)致答案產(chǎn)生巨大的差異,這種不確定性使它們的可靠性受到質(zhì)疑。
因此,目前仍然存在爭議。微軟聲稱這些技術(shù)即將解決我們所有的問題,這是有一定道理的,但我們也有理由保持謹慎。我認為,測試方法和評估機制在這方面很有幫助。我們可以盡可能地進行詳盡的測試,但即便如此,這些系統(tǒng)仍然只是充滿潛力,結(jié)果如何還有待觀察。(本文首發(fā)于,作者|蔡鵬程,編輯|劉洋雪)