媒體界 > 峰會(huì)論壇 > 正文內(nèi)容

直擊2024WCC現(xiàn)場(chǎng)：從棋盤(pán)世界看大模型落地

發(fā)布時(shí)間：2024-12-05 17:22 來(lái)源：鈦媒體APP 作者：蘇婉清

文 | AI大模型工場(chǎng)，作者｜參商，編輯｜星奈

2016年，AlphaGo橫空出世，以4:1的戰(zhàn)績(jī)擊敗世界圍棋冠軍李世石，震驚全球。

AlphaGo的勝利成功地展示了AI在解決復(fù)雜策略問(wèn)題上的潛力，成為人工智能發(fā)展史上的一個(gè)重要轉(zhuǎn)折點(diǎn)。

從象棋到圍棋，從深藍(lán)到AlphaGo，棋盤(pán)上的對(duì)弈不再是單純的勝負(fù)較量，而是人類(lèi)智慧與人工智能深度交融的舞臺(tái)。

如今，AI與棋盤(pán)的故事仍在繼續(xù)。2024年國(guó)際象棋世界冠軍賽（WCC）11月23日正式拉開(kāi)帷幕，現(xiàn)任棋王丁立人接受年僅18歲的印度國(guó)際象棋特級(jí)大師多曼拉朱·古凱什挑戰(zhàn)「王冠之戰(zhàn)」。

值得關(guān)注的是，谷歌作為此次大賽的贊助商，在現(xiàn)場(chǎng)也帶來(lái)了AI深度體驗(yàn)項(xiàng)目。

AI大模型工場(chǎng)有幸受到谷歌邀請(qǐng)來(lái)到在新加坡舉辦的2024年國(guó)際象棋世界冠軍賽（WCC）現(xiàn)場(chǎng)，見(jiàn)證這場(chǎng)巔峰對(duì)決。

在WCC現(xiàn)場(chǎng)，谷歌展示了基于棋類(lèi)AI的最新探索，從AlphaGo到AlphaZero，從Chess Fiction到GenChess，AI在跨越棋盤(pán)，落地我們生活的方方面面。

一、現(xiàn)場(chǎng)直擊WCC，用AI解鎖國(guó)際象棋新玩法

在WCC上，谷歌的AI體驗(yàn)區(qū)成為焦點(diǎn)。三大展臺(tái)Chating Chess、Chess Fiction 和 GenChess，讓AI用游戲的方式幫助大家重新理解象棋。

Chating Chess：象棋知識(shí)一鍵解鎖

顧名思義，Chating Chess，是能夠通過(guò)對(duì)話快速提升觀眾對(duì)國(guó)際象棋的理解水平的“AI解說(shuō)員”。在對(duì)話框中向Gemini提問(wèn)關(guān)于國(guó)際象棋的問(wèn)題，Gemini就會(huì)深入淺出地講解各種復(fù)雜概念

比如，對(duì)象棋小白來(lái)說(shuō)，只需輸入“如何下象棋”這類(lèi)關(guān)鍵詞，Gemini 就能詳細(xì)講解國(guó)際象棋的規(guī)則，不僅如此，它還能預(yù)測(cè)你的后續(xù)問(wèn)題。同時(shí)，如果你將棋局給它，它還能指導(dǎo)你的棋局下一步。

Chess Fiction：象棋賽事的擬人化演繹

Chess Fiction通過(guò)Gemini模型，將經(jīng)典賽事擬人化，讓不懂國(guó)際象棋的人也能像讀小說(shuō)一樣了解整個(gè)對(duì)戰(zhàn)的過(guò)程，賦予每場(chǎng)比賽敘事的魔力。

例如，當(dāng)你輸入 “將2017年侯逸凡對(duì)戰(zhàn)Borya Ider的比賽改編成一個(gè)奇幻故事”，Gemini 會(huì)生成以下充滿想象力的內(nèi)容：

在神秘的直布羅陀王國(guó)，一位名為侯逸凡的女巫以精妙的策略和冷靜的判斷統(tǒng)治棋盤(pán)。面對(duì)充滿大膽與冒險(xiǎn)精神的蒙古騎士Borya，他們展開(kāi)了一場(chǎng)智謀與魔法的對(duì)決。侯逸凡召喚了“迷人的棋子”和“無(wú)懈可擊的防御網(wǎng)”，而B(niǎo)orya釋放的“兇猛騎士”與“雷霆般的攻擊”同樣讓人屏息凝神……

即便是毫無(wú)棋藝基礎(chǔ)的觀眾，也能通過(guò)這種敘事方式，感受到棋盤(pán)上的緊張與刺激，體會(huì)象棋場(chǎng)上的激烈對(duì)決。

GenChess：打造你的專(zhuān)屬棋盤(pán)

在AI體驗(yàn)環(huán)節(jié)，最具創(chuàng)意的還要當(dāng)屬GenChess，可以輸入prompt生成專(zhuān)屬的風(fēng)格化國(guó)際象棋。

比如，我讓Gemini幫我生成了一個(gè)Butter Bear（黃油小熊）的專(zhuān)屬棋子，一個(gè)奶黃色的可愛(ài)小熊棋子，拿捏人心。不僅如此，還可以用同一主題生成不同各具特色的棋盤(pán)進(jìn)行對(duì)弈。

在展示墻上，也放滿了人們的想象力，包括餃子、雞蛋等個(gè)性化的象棋。

實(shí)際上，這些好玩的AI應(yīng)用背后包括圖像生成模型Imagen 3和Gemini Flash模型等。

就在3個(gè)月前，谷歌發(fā)布了圖像生成模型Imagen 3，在文本語(yǔ)義還原、色彩搭配、文本嵌入、圖像細(xì)節(jié)、光影效果等方面相比第二代大幅度提升，同時(shí)還能支持生成人物圖像。GenChess背后Imagen 3功不可沒(méi)。

這些技術(shù)背后都體現(xiàn)了AI在棋盤(pán)世界的新高度，而提到這一切，不得不追溯到AI棋類(lèi)技術(shù)的開(kāi)端，從AlphaGo到AlphaZero，以及背后推動(dòng)這場(chǎng)變革的關(guān)鍵人物。

二、AI棋盤(pán)背后的那個(gè)男人：從AlphaGo到AlphaZero

今年諾貝爾獎(jiǎng)AI成為當(dāng)之無(wú)愧的頂流，先是AI教父辛頓憑借深度學(xué)習(xí)的突破獲得諾貝爾物理學(xué)獎(jiǎng)；第二天 Google DeepMind 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Demis Hassabis。

則因開(kāi)發(fā)了AlphaFold解決蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)難題而獲得諾貝爾化學(xué)獎(jiǎng)。

實(shí)際上，谷歌在棋盤(pán)上取得的成就，Demis Hassabis在其中扮演了重要角色。

在新加坡WCC現(xiàn)場(chǎng)，谷歌組織了一場(chǎng)Demis Hassabis 自傳電影《The Thinking Game》觀影會(huì)。這個(gè)電影耗時(shí)五年拍攝，詳細(xì)講述了Demis及其團(tuán)隊(duì)如何一步一步探索 AI 的未來(lái)發(fā)展，以及為人類(lèi)帶來(lái)的價(jià)值。

Demis的故事始于棋盤(pán)，13歲時(shí)，他已是國(guó)際象棋少年冠軍，并且世界排名第二。那時(shí)，他腦海中萌生了一個(gè)獨(dú)特的想法：如果將所有人類(lèi)智慧與計(jì)算機(jī)結(jié)合，會(huì)發(fā)生什么？

Demis似乎一直在思考，14歲考上牛津，他本可以在15歲時(shí)進(jìn)入劍橋?qū)W習(xí)計(jì)算機(jī)科學(xué)，但他延遲了兩年才入學(xué)。在此期間，他進(jìn)入公司，設(shè)計(jì)開(kāi)發(fā)出經(jīng)典模擬游戲《主題公園》。

但這只是開(kāi)始，他始終在思考大腦是如何工作的，為了更深入地了解大腦的工作原理，Demis在2005年進(jìn)入倫敦大學(xué)學(xué)院攻讀認(rèn)知神經(jīng)科學(xué)博士學(xué)位，并開(kāi)創(chuàng)性地發(fā)現(xiàn)了大腦中海馬體與情景記憶間的關(guān)系。

2010年，Demis與蘇萊曼、謝恩·萊格共同創(chuàng)辦了DeepMind，目標(biāo)明確：創(chuàng)造能夠“思考”的人工智能。2016年，AlphaGo的問(wèn)世震撼全球，這個(gè)AI程序不僅在圍棋上戰(zhàn)勝了世界冠軍李世石，更向世界證明了人工智能在復(fù)雜認(rèn)知任務(wù)上的強(qiáng)大潛力。隨后的2017年，AlphaGo以3:0的比分擊敗圍棋世界第一柯潔，再次刷新了人類(lèi)對(duì)AI的認(rèn)知。

但Demis沒(méi)有止步于此。兩年后，AlphaZero的推出，徹底改變了游戲規(guī)則。不同于AlphaGo的圍棋專(zhuān)項(xiàng)訓(xùn)練，AlphaZero通過(guò)自我對(duì)弈，迅速掌握圍棋、國(guó)際象棋和將棋的復(fù)雜規(guī)則，超越了所有人類(lèi)頂級(jí)棋手的水平。

2018年，Demis再次將目標(biāo)鎖定在科學(xué)的前沿：蛋白質(zhì)折疊。通過(guò)AlphaFold，DeepMind成功預(yù)測(cè)了蛋白質(zhì)的三維結(jié)構(gòu)，并且將所有成果開(kāi)源。

電影中經(jīng)常出現(xiàn)的列車(chē)旅行場(chǎng)景仿佛象征著人生的旅途以及關(guān)于AGI發(fā)展的征程。

最打動(dòng)我的是Demis對(duì)于AGI闡釋 “人工智能需要具備通用性，即，可以解決任意問(wèn)題而不是單一問(wèn)題。這是智慧的體現(xiàn)?！?/p>

從AlphaGo到AlphaZero再到AlphaFold，Demis對(duì)于AGI的技術(shù)理念奠定了Gemini系列模型發(fā)展的基石，Google在棋盤(pán)上驗(yàn)證的技術(shù)也在不斷向更廣泛的醫(yī)療、文化、社會(huì)領(lǐng)域擴(kuò)展。

三、從棋局開(kāi)始，不止棋局

自20世紀(jì)50年代以來(lái)，游戲一直是人工智能的試驗(yàn)場(chǎng)。

1990年，奇努克(Chinook)機(jī)器擊敗了世界上最好的跳棋選手，這是一個(gè)轉(zhuǎn)折點(diǎn)。7年之后，IBM的“深藍(lán)”超級(jí)計(jì)算機(jī)超越了國(guó)際象棋特級(jí)大師加里·卡斯帕羅夫(Garry Kasparov)。

2011年，另一臺(tái)IBM機(jī)器“沃森”超越了《危險(xiǎn)邊緣》游戲的所有贏家。

之后，谷歌的AlphaGo橫空出世、 AlphaZero全面進(jìn)化，AI在棋類(lèi)領(lǐng)域的勝利不僅展示了其超越人類(lèi)的決策能力，更驗(yàn)證了深度學(xué)習(xí)的潛力。

自2022年OpenAI發(fā)布ChatGPT后，大模型爆火出圈，從科技巨頭到初創(chuàng)公司，從模型到應(yīng)用，AI發(fā)展進(jìn)入加速期。

谷歌也迅速響應(yīng)，去年年底Gemini1.0誕生，當(dāng)時(shí)和市面上現(xiàn)有大語(yǔ)言模型相比，Gemini從一開(kāi)始定位就是多模態(tài)模型，可以處理包括文本、圖像、視頻、音頻等不同類(lèi)型的信息。

今年2月，Google又推出了擁有百萬(wàn)token超長(zhǎng)上下文窗口的Gemini 1.5 。三個(gè)月后又推出1.5 Pro ，上下文長(zhǎng)度翻倍，達(dá)到200萬(wàn)token，同時(shí)也推出輕量級(jí)Gemini 1.5 Flash，速度更快、效率更高。

同時(shí)，在多模態(tài)領(lǐng)域，谷歌也發(fā)布了文生圖工具Imagen 3、與Youtube&音樂(lè)家合作的“AI音樂(lè)沙盒”，以及視頻生成模型Veo。

如果說(shuō)去年大家還在卷模型，到今年一個(gè)明顯的變化是卷向應(yīng)用層，讓AI落地到應(yīng)用場(chǎng)景成了潮水翻涌的方向。

在Gemini模型的加持下，谷歌在應(yīng)用方面也做出不少探索。

除了上文展示的Chess Fiction、Chating Chess、GenChess等在棋盤(pán)上推出的應(yīng)用外，谷歌在AI搜索中引入多模態(tài)搜索功能，計(jì)劃推出訂閱服務(wù)“Gemini Advanced”，允許用戶定制個(gè)性化助手，實(shí)現(xiàn)高度個(gè)性化交互。

在辦公領(lǐng)域，谷歌將Gemini 1.5 Pro整合至Workspace Labs，用戶可利用AI快速生成郵件摘要、分析PDF附件、提取Google Meet錄音摘要等，提升辦公效率。

在端側(cè)，則計(jì)劃將輕量化的Gemini Nano引入Pixel手機(jī)，借助“Circle to Search”功能，用戶通過(guò)簡(jiǎn)單手勢(shì)即可搜索文字、圖片、視頻或音頻，進(jìn)一步優(yōu)化移動(dòng)端AI體驗(yàn)。

還有最近爆火的AI播客生成工具NotebookLM，連OpenAI CEO奧特曼都連連稱(chēng)贊。

事實(shí)上，當(dāng)下國(guó)內(nèi)外的大模型公司已經(jīng)逐漸從單純的技術(shù)比拼階段，悄然向產(chǎn)品應(yīng)用的競(jìng)爭(zhēng)維度過(guò)渡。谷歌在這一轉(zhuǎn)型浪潮中，憑借自身極為廣泛且完善的產(chǎn)品生態(tài)體系，將AI技術(shù)落地到搜索、辦公軟件、手機(jī)等諸多實(shí)際應(yīng)用場(chǎng)景之中，穩(wěn)步構(gòu)建起龐大而多元的商業(yè)生態(tài)格局，并確立其在市場(chǎng)中的領(lǐng)先地位。

谷歌的AI技術(shù)在棋盤(pán)上找到歸宿，但它的影響力早已突破棋局本身。棋盤(pán)的勝利成為AI技術(shù)向辦公、生活、醫(yī)療、科學(xué)等更廣泛領(lǐng)域延展的基石。AI正在不斷突破行業(yè)邊界，融入人類(lèi)社會(huì)的方方面面。

棋局之上，AI為人類(lèi)解鎖了更多可能。

注：部分Google技術(shù)僅適用于出海開(kāi)發(fā)者。

更多>同類(lèi)內(nèi)容