文 | AI大模型工場(chǎng),作者|參商,編輯|星奈
2016年,AlphaGo橫空出世,以4:1的戰(zhàn)績(jī)擊敗世界圍棋冠軍李世石,震驚全球。
AlphaGo的勝利成功地展示了AI在解決復(fù)雜策略問(wèn)題上的潛力,成為人工智能發(fā)展史上的一個(gè)重要轉(zhuǎn)折點(diǎn)。
從象棋到圍棋,從深藍(lán)到AlphaGo,棋盤(pán)上的對(duì)弈不再是單純的勝負(fù)較量,而是人類(lèi)智慧與人工智能深度交融的舞臺(tái)。
如今,AI與棋盤(pán)的故事仍在繼續(xù)。2024年國(guó)際象棋世界冠軍賽(WCC)11月23日正式拉開(kāi)帷幕,現(xiàn)任棋王丁立人接受年僅18歲的印度國(guó)際象棋特級(jí)大師多曼拉朱·古凱什挑戰(zhàn)「王冠之戰(zhàn)」。
值得關(guān)注的是,谷歌作為此次大賽的贊助商,在現(xiàn)場(chǎng)也帶來(lái)了AI深度體驗(yàn)項(xiàng)目。
AI大模型工場(chǎng)有幸受到谷歌邀請(qǐng)來(lái)到在新加坡舉辦的2024年國(guó)際象棋世界冠軍賽(WCC)現(xiàn)場(chǎng),見(jiàn)證這場(chǎng)巔峰對(duì)決。
在WCC現(xiàn)場(chǎng),谷歌展示了基于棋類(lèi)AI的最新探索,從AlphaGo到AlphaZero,從Chess Fiction到GenChess,AI在跨越棋盤(pán),落地我們生活的方方面面。
一、現(xiàn)場(chǎng)直擊WCC,用AI解鎖國(guó)際象棋新玩法
在WCC上,谷歌的AI體驗(yàn)區(qū)成為焦點(diǎn)。 三大展臺(tái)Chating Chess、Chess Fiction 和 GenChess,讓AI用游戲的方式幫助大家重新理解象棋。
Chating Chess:象棋知識(shí)一鍵解鎖顧名思義,Chating Chess,是能夠通過(guò)對(duì)話快速提升觀眾對(duì)國(guó)際象棋的理解水平的“AI解說(shuō)員”。在對(duì)話框中向Gemini提問(wèn)關(guān)于國(guó)際象棋的問(wèn)題,Gemini就會(huì)深入淺出地講解各種復(fù)雜概念
比如,對(duì)象棋小白來(lái)說(shuō),只需輸入“如何下象棋”這類(lèi)關(guān)鍵詞,Gemini 就能詳細(xì)講解國(guó)際象棋的規(guī)則,不僅如此,它還能預(yù)測(cè)你的后續(xù)問(wèn)題。同時(shí),如果你將棋局給它,它還能指導(dǎo)你的棋局下一步。
Chess Fiction:象棋賽事的擬人化演繹Chess Fiction通過(guò)Gemini模型,將經(jīng)典賽事擬人化,讓不懂國(guó)際象棋的人也能像讀小說(shuō)一樣了解整個(gè)對(duì)戰(zhàn)的過(guò)程,賦予每場(chǎng)比賽敘事的魔力。
例如,當(dāng)你輸入 “將2017年侯逸凡對(duì)戰(zhàn)Borya Ider的比賽改編成一個(gè)奇幻故事”,Gemini 會(huì)生成以下充滿想象力的內(nèi)容:
在神秘的直布羅陀王國(guó),一位名為侯逸凡的女巫以精妙的策略和冷靜的判斷統(tǒng)治棋盤(pán)。面對(duì)充滿大膽與冒險(xiǎn)精神的蒙古騎士Borya,他們展開(kāi)了一場(chǎng)智謀與魔法的對(duì)決。侯逸凡召喚了“迷人的棋子”和“無(wú)懈可擊的防御網(wǎng)”,而B(niǎo)orya釋放的“兇猛騎士”與“雷霆般的攻擊”同樣讓人屏息凝神……
即便是毫無(wú)棋藝基礎(chǔ)的觀眾,也能通過(guò)這種敘事方式,感受到棋盤(pán)上的緊張與刺激,體會(huì)象棋場(chǎng)上的激烈對(duì)決。
GenChess:打造你的專(zhuān)屬棋盤(pán)在AI體驗(yàn)環(huán)節(jié),最具創(chuàng)意的還要當(dāng)屬GenChess,可以輸入prompt生成專(zhuān)屬的風(fēng)格化國(guó)際象棋。
比如,我讓Gemini幫我生成了一個(gè)Butter Bear(黃油小熊)的專(zhuān)屬棋子,一個(gè)奶黃色的可愛(ài)小熊棋子,拿捏人心。不僅如此,還可以用同一主題生成不同各具特色的棋盤(pán)進(jìn)行對(duì)弈。
在展示墻上,也放滿了人們的想象力,包括餃子、雞蛋等個(gè)性化的象棋。
實(shí)際上,這些好玩的AI應(yīng)用背后包括圖像生成模型Imagen 3和Gemini Flash模型等。
就在3個(gè)月前,谷歌發(fā)布了圖像生成模型Imagen 3,在文本語(yǔ)義還原、色彩搭配、文本嵌入、圖像細(xì)節(jié)、光影效果等方面相比第二代大幅度提升,同時(shí)還能支持生成人物圖像。GenChess背后Imagen 3功不可沒(méi)。
這些技術(shù)背后都體現(xiàn)了AI在棋盤(pán)世界的新高度,而提到這一切,不得不追溯到AI棋類(lèi)技術(shù)的開(kāi)端,從AlphaGo到AlphaZero,以及背后推動(dòng)這場(chǎng)變革的關(guān)鍵人物。
二、AI棋盤(pán)背后的那個(gè)男人:從AlphaGo到AlphaZero
今年諾貝爾獎(jiǎng)AI成為當(dāng)之無(wú)愧的頂流,先是AI教父辛頓憑借深度學(xué)習(xí)的突破獲得諾貝爾物理學(xué)獎(jiǎng); 第二天 Google DeepMind 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Demis Hassabis。
則因開(kāi)發(fā)了AlphaFold解決蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)難題而獲得諾貝爾化學(xué)獎(jiǎng)。
實(shí)際上,谷歌在棋盤(pán)上取得的成就,Demis Hassabis在其中扮演了重要角色。
在新加坡WCC現(xiàn)場(chǎng),谷歌組織了一場(chǎng)Demis Hassabis 自傳電影《The Thinking Game》觀影會(huì)。這個(gè)電影耗時(shí)五年拍攝,詳細(xì)講述了Demis及其團(tuán)隊(duì)如何一步一步探索 AI 的未來(lái)發(fā)展,以及為人類(lèi)帶來(lái)的價(jià)值。
Demis的故事始于棋盤(pán),13歲時(shí),他已是國(guó)際象棋少年冠軍,并且世界排名第二。那時(shí),他腦海中萌生了一個(gè)獨(dú)特的想法:如果將所有人類(lèi)智慧與計(jì)算機(jī)結(jié)合,會(huì)發(fā)生什么?
Demis似乎一直在思考,14歲考上牛津,他本可以在15歲時(shí)進(jìn)入劍橋?qū)W習(xí)計(jì)算機(jī)科學(xué),但他延遲了兩年才入學(xué)。在此期間,他進(jìn)入公司,設(shè)計(jì)開(kāi)發(fā)出經(jīng)典模擬游戲《主題公園》。
但這只是開(kāi)始,他始終在思考大腦是如何工作的,為了更深入地了解大腦的工作原理,Demis在2005年進(jìn)入倫敦大學(xué)學(xué)院攻讀認(rèn)知神經(jīng)科學(xué)博士學(xué)位,并開(kāi)創(chuàng)性地發(fā)現(xiàn)了大腦中海馬體與情景記憶間的關(guān)系。
2010年,Demis與蘇萊曼、謝恩·萊格共同創(chuàng)辦了DeepMind,目標(biāo)明確:創(chuàng)造能夠“思考”的人工智能。2016年,AlphaGo的問(wèn)世震撼全球,這個(gè)AI程序不僅在圍棋上戰(zhàn)勝了世界冠軍李世石,更向世界證明了人工智能在復(fù)雜認(rèn)知任務(wù)上的強(qiáng)大潛力。隨后的2017年,AlphaGo以3:0的比分擊敗圍棋世界第一柯潔,再次刷新了人類(lèi)對(duì)AI的認(rèn)知。
但Demis沒(méi)有止步于此。兩年后,AlphaZero的推出,徹底改變了游戲規(guī)則。不同于AlphaGo的圍棋專(zhuān)項(xiàng)訓(xùn)練,AlphaZero通過(guò)自我對(duì)弈,迅速掌握圍棋、國(guó)際象棋和將棋的復(fù)雜規(guī)則,超越了所有人類(lèi)頂級(jí)棋手的水平。
2018年,Demis再次將目標(biāo)鎖定在科學(xué)的前沿:蛋白質(zhì)折疊。通過(guò)AlphaFold,DeepMind成功預(yù)測(cè)了蛋白質(zhì)的三維結(jié)構(gòu),并且將所有成果開(kāi)源。
電影中經(jīng)常出現(xiàn)的列車(chē)旅行場(chǎng)景仿佛象征著人生的旅途以及關(guān)于AGI發(fā)展的征程。
最打動(dòng)我的是Demis對(duì)于AGI闡釋 “人工智能需要具備通用性,即,可以解決任意問(wèn)題而不是單一問(wèn)題。這是智慧的體現(xiàn)?!?/p>
從AlphaGo到AlphaZero再到AlphaFold,Demis對(duì)于AGI的技術(shù)理念奠定了Gemini系列模型發(fā)展的基石,Google在棋盤(pán)上驗(yàn)證的技術(shù)也在不斷向更廣泛的醫(yī)療、文化、社會(huì)領(lǐng)域擴(kuò)展。
三、從棋局開(kāi)始,不止棋局
自20世紀(jì)50年代以來(lái),游戲一直是人工智能的試驗(yàn)場(chǎng)。
1990年,奇努克(Chinook)機(jī)器擊敗了世界上最好的跳棋選手,這是一個(gè)轉(zhuǎn)折點(diǎn)。7年之后,IBM的“深藍(lán)”超級(jí)計(jì)算機(jī)超越了國(guó)際象棋特級(jí)大師加里·卡斯帕羅夫(Garry Kasparov)。
2011年,另一臺(tái)IBM機(jī)器“沃森”超越了《危險(xiǎn)邊緣》游戲的所有贏家。
之后,谷歌的AlphaGo橫空出世、 AlphaZero全面進(jìn)化,AI在棋類(lèi)領(lǐng)域的勝利不僅展示了其超越人類(lèi)的決策能力,更驗(yàn)證了深度學(xué)習(xí)的潛力。
自2022年OpenAI發(fā)布ChatGPT后,大模型爆火出圈,從科技巨頭到初創(chuàng)公司,從模型到應(yīng)用,AI發(fā)展進(jìn)入加速期。
谷歌也迅速響應(yīng),去年年底Gemini1.0誕生,當(dāng)時(shí)和市面上現(xiàn)有大語(yǔ)言模型相比,Gemini從一開(kāi)始定位就是多模態(tài)模型,可以處理包括文本、圖像、視頻、音頻等不同類(lèi)型的信息。
今年2月,Google又推出了擁有百萬(wàn)token超長(zhǎng)上下文窗口的Gemini 1.5 。三個(gè)月后又推出1.5 Pro ,上下文長(zhǎng)度翻倍,達(dá)到200萬(wàn)token,同時(shí)也推出輕量級(jí)Gemini 1.5 Flash,速度更快、效率更高。
同時(shí),在多模態(tài)領(lǐng)域,谷歌也發(fā)布了文生圖工具Imagen 3、與Youtube&音樂(lè)家合作的“AI音樂(lè)沙盒”,以及視頻生成模型Veo。
如果說(shuō)去年大家還在卷模型,到今年一個(gè)明顯的變化是卷向應(yīng)用層,讓AI落地到應(yīng)用場(chǎng)景成了潮水翻涌的方向。
在Gemini模型的加持下,谷歌在應(yīng)用方面也做出不少探索。
除了上文展示的Chess Fiction、Chating Chess、GenChess等在棋盤(pán)上推出的應(yīng)用外,谷歌在AI搜索中引入多模態(tài)搜索功能,計(jì)劃推出訂閱服務(wù)“Gemini Advanced”,允許用戶定制個(gè)性化助手,實(shí)現(xiàn)高度個(gè)性化交互。
在辦公領(lǐng)域,谷歌將Gemini 1.5 Pro整合至Workspace Labs,用戶可利用AI快速生成郵件摘要、分析PDF附件、提取Google Meet錄音摘要等,提升辦公效率。
在端側(cè),則計(jì)劃將輕量化的Gemini Nano引入Pixel手機(jī),借助“Circle to Search”功能,用戶通過(guò)簡(jiǎn)單手勢(shì)即可搜索文字、圖片、視頻或音頻,進(jìn)一步優(yōu)化移動(dòng)端AI體驗(yàn)。
還有最近爆火的AI播客生成工具NotebookLM,連OpenAI CEO奧特曼都連連稱(chēng)贊。
事實(shí)上,當(dāng)下國(guó)內(nèi)外的大模型公司已經(jīng)逐漸從單純的技術(shù)比拼階段,悄然向產(chǎn)品應(yīng)用的競(jìng)爭(zhēng)維度過(guò)渡。谷歌在這一轉(zhuǎn)型浪潮中,憑借自身極為廣泛且完善的產(chǎn)品生態(tài)體系,將AI技術(shù)落地到搜索、辦公軟件、手機(jī)等諸多實(shí)際應(yīng)用場(chǎng)景之中,穩(wěn)步構(gòu)建起龐大而多元的商業(yè)生態(tài)格局,并確立其在市場(chǎng)中的領(lǐng)先地位。
谷歌的AI技術(shù)在棋盤(pán)上找到歸宿,但它的影響力早已突破棋局本身。棋盤(pán)的勝利成為AI技術(shù)向辦公、生活、醫(yī)療、科學(xué)等更廣泛領(lǐng)域延展的基石。AI正在不斷突破行業(yè)邊界,融入人類(lèi)社會(huì)的方方面面。
棋局之上,AI為人類(lèi)解鎖了更多可能。
注:部分Google技術(shù)僅適用于出海開(kāi)發(fā)者 。